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^ (54) Titre : PLANTES TOLERANTES AUX HERBICIDES PAR CONTOURNEMENT DE VOIE METABOLIQUE 
GO 

(57) Abstract: The invention concerns a novel method for making herbicide-tolerant plants, in particular to HPPD inhibiting her- 
bicides, the nucleic acid sequences coding for enzymes capable of being used in said method, expression cassettes containing them 
and transgenic plants comprising at least one of said expression cassettes. 
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(57) Abreg£ : La prSsente invention concerne une nouvelle methode permettant de rendre les pi antes tolerantes aux herbicides, 
en particulier aux herbicides inhibiteurs d'HPPD, les sequences d'acides nucleiques codant pour des enzymes susceptibles d'etre 

£^ employees dans cette methode, les cassettes d* expression les contenant et les pi antes transgeniques comprenant au moins Tune de 

>^ ces cassettes d' expression. 
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1 Plantes tolerantes aux herbicides par contournenient de voie metabolique 

La preserite invention conceme une nouvelle m6thode permettant de rendre les 
plantes tolerantes aux herbicides, en pariiculier aux herbicides inhibiteurs d'HPPD, les 
5 sequences cPacide nucleique codant pour des enzymes susceptibles d'Stre employees 
dans cette methode, les cassettes d' expression les contenant et les plantes transgeniques 
comprenant au moins Tune de ces cassettes d'expression. 

Les hydroxy-phenyl pyruvate dioxygenases sont des enzymes qui catalysent la 
reaction de transformation du para-hydroxy-ph6nyl-pyruvate (HPP) en homogentisate* 
1 0 Cette reaction a lieu en presence de fer (Fe 2 *) en presence d'oxygene (Crouch Ni\ & aL, 
Tetrahedron, 53, 20, 6993-7010, 1997). 

On connait par ailleurs certaines molecules inhibitrices de cette enzyme, qui 
viennent se fixer k Penzyme pour inhiber la transformation de PHPP en homogentisate. 
Certaines de ces molecules ont trouve un emploi comme herbicides, dans la mesure ou 
15 Pinhibition de la reaction dans les plantes conduit a un blanchiment des feuilles des 
plantes traitees, et a la mort des dites plantes (Pallett K. E. et aL 1997 Pestic. Sci. 50 83- 
84). De tels herbicides ayant ponr dble PHPPD d^crits dans Petat de la technique sont 
notamment les isoxazoles (EP 418 175, EP 470 856, EP 487 352, EP 527 036, EP 560 
482, EP 682 659, US 5 424 276) en particulier Tisoxaflutole, herbicide selectif du imffs, 
20 les dic&onitriles (EP 496 630, EP 496 631), en particulier la 2-cyano-3-cyclopropyl-l- 
(2-SO2 CH3-4-CF3 phenyl) propane- 1,3-dione et la 2-cyano-3-cyclopropyl-l-(2-S02 
CH3-4-2,3 CI2 phenyl) propane-1, 3-dione, les tric^tones (EP 625 505, EP 625 508, US 
5,506,195), en particulier la sulcotrione ou la m&otrione, ou encore les pyrazolinates. 

Des essais pour confirmer que l'HPPD est bien la cible des dicetonitriles (DKN) 
25 et pour mettre en evidence que l'HPPD est, au moins k certaines doses, la cible unique 
des dicetonitriles ont 6t6 effectues en laboratoire en faisant germer des graines 
& Arabidopsis sur trois types de milieux en conditions steriles in-vitro : 

1 milieu Murashig et Skoog( Murashige, T. and Skoog, F. 1962. A revised medium for a 
rapid growth and bioassays with tobacco tissue culture. Physiol. Plant 15, 473-479), 

30 experience controle de la germination 

2 milieu MS plus DKN a la dose de Ippm 

3 milieu MS plus DKN a la meme dose + Homogentisate k la concentration de 5 mM. 

n est tres net que sur le milieu 1 la germination se fait normalement, chaque 
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plantule developpant deux cotyledons bien verts. Le developpement se fait ensuite 
normalement. Sur le milieu 2, la germination a lieu mais la plantule qui emerge est 
blanche, les deux cotyledons ne prSsentant aucune pigmentation. Les plantules meurent 
ensuite en quelques jours. Sur le milieu 3, la germination se fait normalement, les 
5 cotyledons sont bien verts. Les plantules se developpent mais tres rapidement, la 
quantite d'homogentisate dans le milieu diminuant, les premiers symptomes de 
blanchiment apparaissent et la croissance des plantes s'arretent, elles finissent par 
mourir comme dans Tessai effectue sur le milieu n°2. 

Ceci permet de confirmer que THPPD est bien la cible des DKN in planta et 
10 qu'elle semble etre la cible unique. Ceci montre aussi que Thomogentisate^st transports 
du milieu de culture jusqu'au site cellulaire ou il est necessaire pour le bon 
fonctionnement de la cellule et la survie de la plante. 

Pour rendre les plantes tolerantes aux herbicides, on dispose actuellement de 
trois strategies, (1) la detoxification de Therbicide par une enzyme venant transformer 
15 Therbicide, ou son metabolite actif, en produits de degradation non toxique, comme par 
exemple les enzymes de tolerance au bromoxynil ou au basta (EP 242 236, EP 337 
899) ; (2) la mutation de Fenzyme cible en une enzyme fonctionnelle moins sensible a 
Therbicide, ou son metabolite acti£ comme par exemple les enzymes de tolerance au 
glyphosate (EP 293 356, Padgette S. R. & al., J. BioL Chem., 266, 33, 1991) ; ou (3) la 
20 surexpression de Tenzyme sensible, de maniere a produire dans la plante des quantites 
suffisantes d' enzyme cible au regard des constantes cinetiques de cette enzyme vis a vis 
de Therbicide de maniere a avoir suffisamment d'enzyme fonctionnelle, malgrg la 
presence de son inhibiteur. 

C'est cette troisieme strat^gie qui a ete decrite pour obtenir avec succes des 
25 plantes tolerantes aux mhibiteurs d'HPPD (WO 96/38567), etant entendu que pour la 
premiere fois une strategie de simple surexpression de Tenzyme cible sensible (non 
mut6e) etait employee avec succes pour confSrer aux plantes une tolerance a un niveau 
agronomique a im herbicide. I/identification d'HPPD mutees dans leur partie C- 
terminal presentant une tolerance am61ior6e aux inhibiteurs d'HPPD a permis d'obtenir 
30 ime amelioration de la tolerance des plantes par la mise en oeuvre de la deuxieme 
strat£gie (WO 99/24585). 

La pr&sente invention consiste en une nouvelle m&hode permettant de rendre les 
plantes tolerantes a un herbicide qui met en oeuvre une nouvelle ou quatri&me strategie 



BMSDOCID: <WO 0236787A2J_> 



15 



20 



25 



30 



WO02/36787 3 PCT/moi/03364 

de tolerance herbicide, cette nouvelle strategie comprenant le contournement de la voie 
metaboUque inbibee par ledit herbicide. Ce contoumement metabolique peut se resumer 
comme suit : ' " ~ ' . 

> soit un herbicide «H» actif en inhibant l'activite d'une enzyme «E» qui 
5 transfonne le substrat « S >> en produit « P », ledit produit P et ses metabolites etant 

essentiels a la vie de la plante, 

> le contoumement metabolique consiste a exprimer dans la plante au moins une 
nouvelle enzyme « NE » heterology insensible a « H » permettaht la conversion de 
« S » en un produit intermediaire « I », lequel est ensuite transfonne en « P » soit 

10 pas les voies de biosynthese naturelles de la plante soit par l'expression d'au moins 
une autre enzyme heterologue « AE » egalement insensible a « H », 

> le contoumement metabolique consistant egalement a exprimer au moins une autre 
enzyme heterologue « AE » insensible a « H » permettant la conversion de « I » en 
«P», « I » etant soit un mterm^diaire naturellement produit par la plante soit 
obtenu par l'expression d'au moins une nouvelle enzyme heterologue «NE» 
insensible a « H » permettant la conversion de « S » en « I ». 

La pr&ente invention conceme plus particulierement une nouveUe methode 
permettant de rendre les plantes to^rantes aux inhibiteurs d'HPPD, ladite methode 
comprenant le contoumement metabolique de l'HPPD. 

Aucune voie de contoumement metabolique n'a ete decrite a ce jour dans les 
plantes. 

On connait de la Mtterature que la conversion de l'HPP en homogentisate peut etre 
obtenue en effectuant d'abord une conversion de l'HPP en acide 4- 
hydroxyphenylacetique (4-HPA) par un extrait enzymatique presentant une activite 
HPP oxydase suivie de la conversion du 4-HPA en homogentisate par un extrait 
enzymatique presentant une activity 4-HPA 1-hydrolase (WO 99/34008). Cette voie de 
contoumement est representee par la Figure 1 . 

Une etude bibhographique n*vele que les activites enzyrnatiques necessaires pour la 
construction de la voie de contoumement de l'HPPD but ete caracterisees sur des 
extraits bruts bacteriens dans les annees 1970. Ainsi, les activites HPP oxydase (HPPO, 
EC. 1.2.3.-) et 4-HPA 1-hydroxylase (HPAH, B.C. 1.14.13.18.) ont ete identifiees 
respectivement chez Arthrobacter globiformis (Blakley, 1977) et chez Pseudomonas 
acidavorans (Hareland et aL, 1975). Depuis lors, seule la HPAH a ete purifiee par 
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Suemori et ah (1996); cependant, ni la sequence piroteique ni la sequence nucleique ne 
sont publiees. II feut done identifies les gSnes codant ces activites enzymatiques. 

Dans la voie de contournement, la conversion de THPP en HGA se fait via le 4- 
HPA. Or, le 4-HPA est un compost rarement identifie chez les plantes. II est present 
5 chez YAstilbe chinensis (Kindl, 1969), dans les Plantago sp. (Swiatek, 1977), dans le 
pissenlit {Taraxacum officinale ; Dey & Harborne, 1997), chez les Artemisia (Swiatek et 
al, 1998), dans le fruit du Forsythia suspensa (Liu et al. 3 1998) et enfin chez Palgue 
marine Ulva lactuca (Flodin et a/., 1999). II y a peu de donnees sur son origine. II 
semble pouvoir provenir de la tyrosine, du shikimate, de la tyramine. II n'y a pas 

10 davantage d'information sur son devenir et son rdle dans la plante. Kindl (1969) a 
montre sa degradation via Facide 3,4-dihydroxyphenylacetique tandis que Flodin et aL 
(1999) ont demontre sa conversion via Tacide 4-hydroxymandelique en 2,4,6- 
tribromophenol qui s'accumule dans l'algue verte Ulva lactuca. Gross (1975) sugg^re 
que le 4-HPA pourrait etre un rSgulateur de croissance chez certaines plantes 

15 superieures et Abe et al. (1974) le considerent comme un analogue d'auxirie chez les 
algues. 

Pour mettre en oeuvre la voie de contournement m6tabolique de l'HPPD il aura fallu 
au prealable identifier et isoler les genes et les sequences d'acide nucleique codant pour 
la ou les enzymes responsables des deux activites ci-dessus. 

20 Definitions selon F invention 

« Sequence d'acide nucleique » : une sequence nucleotidique ou polynucleotide, 
: , pouvant etre de type ADN ou ARN, de preference de type ADN, notamment double 
brin. La sequence d'acide nucleique f>eut etre d'origine naturelle, en particulier ADN 
genomique ou ADNc, ou encore une sequence synthetique ou semi-synthetique, les 

25 acides nucleiques la comprenant ayant 6t6 choisis soit pour optimiser les codons d'une 
sequence codante en fonction de 1'organisme hote dans lequel elle sera exprim6e, soit 
pour introduire ou eiiminer un ou plusieurs sites de restriction. Les methodes de 
preparation des sequences d'acide nucleique synthetiques ou semi-synthetiques sont 
bien connues de 1'homme du metier. 

30 « Sequence capable de s'hybridiser de maniere selective » : les sequences d'acide 
nucleique qui s'hybrident avec tine sequence d'acide nucleique de reference a un niveau 
supperieur au bruit de fond de maniere significative. Le bruit de fond peut etre lie a 
Thybridisation d'autres sequences d'ADN presentes, notamment d'autres ADNc 
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presentes dans unebanque d'ADNc. Le niveau du signal genere par l'interaction entre la 
sequence capable de s'hybridiser de maniere selective et les sequences definies par les 
sequence ID ci-dessus selon 1'invention est generalement 10 fois, depreference 100 ibis 
plus intense que celui de l'interaction des autres sequences d'ADN gfeerant le bruit de 
5 fond. Le niveau d'interaction peut etre mesurdpar exemple , par marquage de la sonde 
avec des elements radioactifc, comme le 32P. L'hybridation selective est generalement 
obtenue en employant des conditions de milieu tres severes (par exemple NaCl 0,03 M 
et citrate de sodium 0,03 M a environ 50°C-60°C). L'hybridation peut bien entendu etre 
effectuee selon les methodes usuelles de l'etat de la technique (notamment Sambrook & 
10 al., 1989, Molecular Cloning: A Labratory Manual). -r 

«HomoJogue d'une sequence d'acide nucleique» : sequence d'acide nucl6ique 
presentant une ou plusieurs modifications de sequence par rapport a une sequence 
d'acide nucleique de reference. Ces modifications peuvent etre obtenues selon les 
techniques usuelles de mutation, ou encore en choisissant les ohgonucleotides 
15 synthefiques employes dans la preparation de ladite sequence par hybridation. Au regard 
des multiples combinaisons d'acides nucl6iques pouvant conduire a 1 'expression d'un 
meme acide amine, les differences entre la sequence de reference selon 1'invention et 
l'homologue correspondant peuvent etre importantes. De maniere avantageuse, le degre 
d'homologie sera d'au moins 60 % par rapport a la sequence de reference, de preference 
20 d'au moins 70 %, plus preferentieUement d'au moins 80%, encore plus 
preferentiellement d'au moins 90 %. Ces modifications sont generalement et de 
preference neutres, c'est a dire que pout une sequence codante eUes n'affectent pas la 
sequence primaire de la proline ou du peptide code. EUes peuvent toutefois mtroduire 
des modifications non silencieuses, ou mutations, qui n'affectent pas la fonction de la 
25 sequence d'acide nucleique par rapport a la sequence de reference. Les methodes de 
mesure et ^identification des homologies entre les sequences d'acides nucleiques sont 
bien connues de l'homme du metier. On peut employer par exemple les programmes 
PILEUP ou BLAST (notamment Altschul & al., 1993, J. Mol. Evol. 36 :290-300 ; 
Altschul & al., 1990, J. Mol. Biol. 215 :403-10). 
30 « Fragments » : fragment d'une sequence d'acide nucleique ou polypeptidique de 
reference pour laquelle des parties ont ete deletees mais qui conservent la fonction de 
ladite sequence de reference. 

«Heterologue»: sequence d'acide nucleique differente de la sequence d'acide 
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nucleique ay ant lajmfime fonction dans un organisme natureLUrie sequence h6t6rologue 
peut consister en une sequence d'acide nucleique modifiee in situ dans son 
enyironement naturel. II peut egalement s'agir d'une sequence d'acide nucleique isolee 
de son organisme naturel puis r£introduite dans ce merue organisme. II peut egalement 
5 , s'agit d'une sequence d'acide nucleique h&6rologue par rapport k une autre sequence 
d'acide nucteique, c'est k dire une sequence associee a une autre sequence, cette 
association ne se trouvant pas dans la nature. C'est le cas notamment des cassettes 
d'expression constitutes de diff&rentes sequences d'acide nucleique ne se trouvant pas 
gen&alement associees dans la nature. 

10 « Homologue d'une sequence proteique » : sequences prot&ques dont la sequence 
primaire est differente de la sequence primaire de la proline de r6f<§rence, mais qui 
remplit la meme fonction que cette sequence de reference. Les m6thbdes de mesure et 
d'identification des homologies entre polypeptides ou proteines sont egalement connues 
de 1'homme du metier. On peut employer par exemple le « package » UWGCG et le 

15 programme BESTFITT pour calculer les homologies (Deverexu & al., 1984, Nucleic 
Acid Res. 12, 387-395). 

« Cassette d'expression » : sequence d'acide nucleique comprenant differents 
elements fonctionnels necessaires a 1'expression d'une sequence codante dans un 
organisme hote. Ces fitments fonctionnels comprennent dans le sens de la transcription 

20 une sequence de regulation promotrice, Egalement appelee promoteur, liee de maniere 
fonctionnelle k une sequence codante et une sequence de regulation terminatrice, 
Egalement appelee terminateur ou stop. La cassette d'expression peut egalement 
comprendre entre la sequence de regulation promotrice et la sequence codante des 
elements de regulations tels que des activateurs de transcription ou « enhancers » et/ou 

25 desintrons. 

« Organisme hote»: on entend essentiellement selon Pinvention les cellules 
v<§g6tales ou les plantes. Pour les vecteurs de clonages, les organismes hotes peuvent 
egalement etre des bacteries, des champignons ou des levures. 

« Cellule v^getale » : cellule issue d'une plante et pouvant constituer des tissus 
30 indifferences tels que des cals, des tissus differences tels que des embryons, des parties 
de plantes, des plantes ou des semences. 

« Plante »: organisme multicellulaire difKrenci6 capable de photosynttese, en 
particuHer monocotytedone ou dicotytedone, plus particuherement des plantes de 
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culture destin^ ou,non a l'alimentation animale ou huniaine, comme le riz, le mats, le 
ble, 1'orge, la canne a Sucre, le colza, le soja, la betterave, la pomme de terre, le tabac, le 
coton, le trefle, le gazon, ou les plantes ornementales comme les petunias,l)u encore les 
bananiers, la vigne, les framboises, les fiaises, les tomates, les salades, etc. 
5 « Sequence de regulation promotrice » : Comme sequence de regulation promotrice 
dans les plantes, on peut utfliser toute sequence de regulation promotrice d-un gene 
s'exprimant natureUement dans les plantes en particulier un promoteur s'exprimant 
notamment dans les feuilles des plantes, comme par exemple des promoteurs dits 
constitutifs d'origine bacterienne, virale ou vegetale ou encore des promoteurs dits 
10 lumiere dependants comme celui d'un gene de la petite sous-unite de ribulose- 
biscarboxylase/oxygenase (RuBisCO) de plante ou tout promoteur convenable connu 
pouvant etre utilise. Parmi les promoteurs d'origine vegetale on citera les promoteurs 
dliistone tels que decrits dans la demande EP 0 507 698, ou le promoteur d'actine de riz 
(US 5,641,876). Parmi les promoteurs d'un gene de virus de plante, on citera celui de la 
15 mosm-quedu chouxfleur(CAMV 19S ou 35S), du CsVMV (US ...) ou le promoteur du 
oncovirus (AU 689 31 1). On peut encore utiliser une sequence de regulation promotrice 
specifique de regions ou de tissus particuliers des plantes, et plus particulierement des 
promoteurs specifiques des graines ([22] Datla, R.& al., Biotechnology Ann. Rev. 
(1997) 3, 269-296), notamment les promoteurs de la napine (EP 255 378), de la 
20 phaseoline, de la glutenine, de rhetiantimne (WO 92/17580), de l'albumine (WO 
98/45460), de 1'oelosine (WO 98/45461), de l'ATSl ou de l'ATS3 (PCT/US98/06978, 
deposee le 20 octobre 1998, incorporee ici par reference). On peut egalement employer 
un promoteur inductible avantageusement choisi parmi les promoteurs de phenylalanine 
ammoniac lyase (PAL), d'HMG-GoA reductase (HMG), de chitinases, de glucanases, 
25 d'inhibiteurs de proteinase (PI), de genes de la famille PR1, de la nopaline synthase 
(nos) ou du gene vspB (US 5 670 349, Tableau 3), le promoteur HMG2 (US 5 670 349), 
le promoteur de la beta-galactosidase (ABG1) de pomme ou le promoteur de ramino 
cyclopropane carboxylate syntase (AGC synthase) de pomme (WO 98/45445). 

« Activateurs de transcription ("enhancer") » : on citera par exemple l'activateur de 
30 transcription du virus de la mosaTque du tabac (VMT) decrit dans la demande WO 
87/07644, ou du virus etch du tabac (VET) decrit par Carrington & Freed. 

«Introns» : sequences d'acide nucleique non traduites. On citera par exemple 
1'intron 1 du gene d'histone d'Arabidopsis tel que decrit dans la demande de brevet 
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WO 97/04114 pQurune expression dans les plantes dicotytedones, le premier intron de 
Factine de riz decrit dans la demande de brevet WO 99/34005, ou Fintron adhl de mais 
pour une expression dans les plantes monocotytedones. 

« Sequence codante » : sequence d'acide nucteique traduite. EUe comprend une 
5 sequence codant pour une proteine ou un peptide d'int&ret, 6ventuellement fusionnee en 
5' ou en 3* avec une sequence codant pour un peptide signal ou d'adressage vers un 
compartiment cellulaire particulier. 

« Peptide signal ou d'adressage » : peptides fusionnes a une proline ou k un 
peptide d'interet dans leur partie N- ou C-terminale, reconnus par la machinerie 

10 cellulaire permettant Fadressage de la proline ou du peptide d'interSt vers un 
compartiment cellulaire particulier. II s'agit en particulier de peptides de transit 
chloroplastiques permettant Fadressage de la proteine ou du peptide d'interet dans les 
chloroplastes, ou de peptides signaux vers divers compartiments cellulaires, par 
exemple la vacuole, les mitochondries, le reticulum endoplastique, Fappareil de golgi, 

15 etc. Le role de telles sequences proteiques sont notamment d^crites dans le numero 38 
de le revue Plant molecular Biology (1998) consacre en grande partie aux transports des 
proteihes dans les difl&rents compartiments de la cellule vegetale (Sorting of proteins to 
vacuoles in plant cells pp 127-144 ; the nuclear pore complex ppl45-162 ; protein 
translocation into and across the chloroplastic enveloppe membranes pp 91-207 ; 

20 multiple pathways for the targeting of thylakoid proteins in chloroplasts pp 209-221 ; 
mitochondrial protein import in plants pp 3 1 1-338). 

« Peptide de transit chloroplastique » : le peptide de transit chloroplastique est code 
par une sequence d'acide nucl£ique en 5' de la sequence d'acide nucl6ique codant pour 
une proteine ou un peptide d'interet, de maniere a permettre Fexpression d'une proline 

25 de fusion peptide de transit/proteine (peptide) d'interet Le peptide de transit permet 
d'adresser la proteine ou le peptide d'interet dans les plastes, plus particulidrement les 
chloroplastes, la proteine de fusion etant clivee entre le peptide de transit et la proteine 
ou le peptide d'interet au passage de la membrane des plastes. Le peptide de transit peut 
etre simple, comme un peptide de transit d'EPSPS (US 5,188,642) ou un peptide de 

30 transit de la petite sous-unite de ribulose-biscarboxylase/oxygSnase ( ssu RuBisCO) 
d'une plante, eventuellement comprenant quelques acides amines de la partie N- 
terminale de la ssu RuBisCO mature (EP 189 707) ou encore un peptide de transit 
multiple comprenant un premier peptide de transit de plante fusionng k une partie de la 
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sequence N-terminale d'une proline mature a locahsation plastidiale, fusionriee a un 
deuxieme peptide de transit de plante tel que decrit dans le brevet EP 508 909, et plus 
particulierement le peptide de transit optimise comprenant uh peptide de'transit de la ssu 
RuBisCO de toumesol fusionne a 22 acides amines de l'extremite N-terminale de la ssu 
RuBisCO de mars fusionnee au peptide de transit de la ssu RuBisCO de mafe tel que 
decrit avec sa sequence codante dans le brevet EP 508 909. 

« Peptide signal » : ces sequences peptidiques sont notamment decrites dans le 
numero 38 de le revue Plant molecular Biology (1998) consacre en grande partie aux 
transports des proteines dans les differents compartiments de la cellule vegetale (Sorting 
of proteins to vacuoles in plant cells pp 127-144 ; the nuclear pore complex ppl45*162 ;'; 
protein translocation into and across the chloroplastic enveloppe membranes pp 91-207 ; 
multiple pathways for the targeting of thylakoid proteins in chloroplasts pp 209-221 ; 
mitochondrial protein import in plants pp 311-338). Des peptides d'adressage vers la 
vacuole sont largements decrits dans la htterature (Neuhaus J.M. and Rogers J.C Sorting 
of proteins to vacuoles in plant cellsPlant molecular Biology 38 : 127-144, 1998). De 
preference, le peptide vacuolaire est le peptide vacuolaire de la proteine decrite dans 
J.M. Ferullo et al (Plant Molecular Biology 33 : 625-633, 1997), fusionne a la partie C- 
terminale de la proteine ou du peptide d'interet. 

« Sequence de regulation terniinatrice » : comprenant egalement les sequences de 
polyadenylation, on entend toute sequence fonctionneUe dans les cellules vegetales ou 
les plantes qu'elles soient d'origine bacterienne, comme par exemple le terniinateur nos 
d'Agrobacterium tumefaciens, d'origine virale, comme par exemple le tenninateur du 
CaMV 35S, ou encore d'origine veg6tale, comme par exemple un terminateur dnistone 
tel que decrit dans la demande EP 0 633 3 17. 
25 « Vecteur » : vecteur de clonage et/ou d'expression pour la transformation d'un 
organisme hdte contenant au moins une cassette d'expression. Le vecteur comprend 
outre la cassette d'expression, au moins une origine de replication. Le vecteur peut etre 
constitue par un plasmide, un cosmide, un bacteriophage ou un virus, transformes par 
l'introduction de la cassette d'expression. De tels vecteurs de transformation en fonction 
de l'organisme hftte a transformer sont bien connus de l'homme du metier et largement 
decrits dans la htterature. Pour la transformation des cellules vegetales ou des plantes, il 
s'agira notamment d'un virus qui pent etre employe pour la transformation des plantes 
developpees et contenant en outre ses propres elements de rephcation et d'expression. 
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De maniere pr6f&entielle, le vecteur de transformation des cellules v6g&ales ou des 
plantes est un plasmide. 
HPP Oxydase 

Un premier objet de Pinvention concerne une sequence d'acide nucl&que codant 
5 pour une HPP Oxydase, et le polypeptide correspondant De maniere pr6f6rentielle, 
THPP oxydase est insensible aux inhibiteurs d'HPPD, en particulier aux isoxazoles 
comme Pisoxaflutole et leurs dik^tonitriles, notamment ceux definis prec6demment. 
L'HPP oxydase est notamment une HPP oxydase d'origine bacterienne, par exemple 
d'Arthrobacter, en particulier d'Arthrobacter globiformis. L'HPP oxydase est 
10 avantageusement une proline dont la sequence primaire d'acides amines est representee 
par Pidentificateur de sequence n°2 (SEQ ID NO 2) ses sequences homologies et ses 
fragments. 

Des sequences proteiques d'HPP oxydases homologues de la SEQ ID NO 2 sont 
notamment representees par les SEQ ID NO 4 et 6, ses sequences homologues et ses 
15 fragments. - 

L'HPP oxydase representee par la SEQ ID NO 4 correspond a PHPP oxydase de la 
SEQ ID NO 2 pour laquelle une Glycine est remplacee par une Alanine. 

La presente invention concerne egalement une sequence d'acide nucleique codant 
pour une HPP oxydase telle que definie ci-dessus. 
20 De maniere preferentielle, la sequence codant pour THPP oxydase est une sequence 
d'ADN, notamment ADN genomique ou ADN-c, en particulier une sequence 
h&erologue ou isotee. 

La sequence codant pour une HPP oxydase selon Pinvention est notamment choisie 
parmi les sequences codantes des sequences d'ADN representees par les SEQ ID NO 1, 
25 3, 5 ou 15, leurs sequences homologues, leurs fragments et les sequences capable de 
s'hybrider de maniere selective aux SEQ ID 1, 3, 5 ou 15. 

La sequence codante de la SEQ ID NO 5 compre nd trois mutations en positions 
463, 602 et 1511 par rapport k la SEQ ID NO 1 qui sont silencieuses, c'est k dire 
n'introduisant aucune modification du polypeptide correspondant. 
30 4-HPA 1 -hydroxylase 

Un deuxfeme objet de Pinvention concerne les moyens necessaires a Pexpression de 
la 4-HPA 1 -hydroxylase. Contrairement a ce qui etait attendu de la literature sur 
Pactivite de certains extraits proteiques, il a 6te constate que Pactivite 4-HPA 1- 
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hydroxylase dansJes bactenes, en particulier Pseudomohds, resultait de la somme de 
1'activite de deux enzymes denommees ci-apres HP AH et HPAC. • :. 

HP AH ; 

L'HPAH permet la conversion de l'HPA en metabolite interniediaire denomme ci. 
apres metabolite Z dont la structure reste mdeterminee. D peut etre envisage 
serieusement que l'HPAH permet l'hydroxylation du noyau aromatique de l'HPA, le 
metabolite Z se stabilisant sous forme d'une cetone. Cette hypothese d'activite 
en2ymatique est representee sur la figure 2. 

Un deuxieme objet de l'invention concerne done une sequence d'acide nucleique 
codant pour une HP AH, et le polypeptide correspondant De maniere preferentielle, 
l'HPAH est insensible aux inhibiteurs d'HPPD, en particuUer aux isoxazoles comme 
l'isoxaflutole et leurs diketonitriles, notamment ceux defims precedemment. L'HPAH 
est notamment une HP AH d'origine bacterienne, par exemple de Pseudomonas, en 
particulier de Pseudomonas acidovoram. L'HPAH est avantageusement une proteine 
15 dont la sequence primaire d'acides amines est representee par les identificateurs de 
sequence n°8 et 18 (SEQ ID NO 8 et SEQ ID NO 18) leurs sequences homologies et 
leurs fiagments. 

La presente invention concerne egalement une sequence d'acide nucleique codant 
pour une HPAH telle que definie ci-dessus. 
20 De maniere preferentielle, la sequence codant pour l'HPAH est une sequence 
d'ADN, notamment ADN genomique ou ADN-c, en particuKer une sequence 
heterologue ou isol^e. 

La sequence codant pour une HPAH selon l'invention est notamment choisie parmi 
les parties codantes des sequences representees par les SEQ ID NO 7 ou 17, leurs 
sequences homologies, leurs fragments et les sequences capable de s'hybrider de 
mani&re selective aux SEQ ID NO 7 ou 17. 
HPAC 

L'HPAC est la deuxieme enayme permetant la conversion du metabolite Z en en 
homogentisate. 

Un troisidme objet de l'invention concerne done une sequence d'acide nucleique 
codant pour une HPAC, et le polypeptide correspondant. De maniere preferentielle, 
l'HPAC est insensible aux inhibiteurs d'HPPD, en particulier aux isoxazoles comme 
l'isoxaflutole et leurs diketonitriles, notamment ceux definis precedemment L'HPAH 
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est notamment ime JHP AC d'origine bacterienne, par exemple de Psettdomonas, en 
particulier de Pseudomonas acidovorans.UH&AR est avantageusement une proteine 
dont la sequence primaire d'acides amines est representee par Pidentificateur de 
sequence n°10 (SEQ ID NO 10) ses sequences homologues et ses fragments. 
5 Des sequences prot6iques d'HPAC homologues de la SEQ ID NO 10 sont 
notamment representees par les SEQ ID NO 12, 14 et 20, leurs sequences homologues 
et leurs fragments. 

La presente invention conceme egalement une sequence d'acide nucleique codant 
pour une HP AC teUe que definie ci-dessus. 
10 De maniere pr6f&rentielle, la sequence codant pour PHPAC est une sequence 
..... d' ADN, notamment ADN genomique ou ADN-c, en particulier une sequence 
h6t&ologue ou isolee. 

La sequence codant pour une HPAC selon Pinvention est notamment choisie parmi 
les parties codantes des sequences representees par les SEQ ID NO 9, 11, 13 ou 19, 
15 leurs sequences homologues, leurs fragments et les sequences capables de s'hybrider de 
maniere selective aux SEQ ID NO 9, 1 1, 13 ou 19. 
Cassettes d'expression 

La presente invention conceme egalement une cassette d'expression dont la 
sequence codante comprend une sequence d'acide nucleique selectionnee parmi les 

20 sequences d'acide nucleique codant pour une HGA oxydase, une HGAH ou HGAC 
telles que d6finies ci-dessus. 

La sequence codante peut egalement comprendre en 5' ou en 3* une sequence codant 
pour un peptide signal ou un peptide de transit. De maniere avantageuse, la sequence 
codante comprend en 5' de la sequence codant pour HGA oxydase, une HGAH ou une 

25 HGAC, une sequence codant pour un peptide de transit d'adressage chloroplastique, en 
particulier un peptide de transit multiple, plus particulierement le peptide de transit 
optimist. 

La presente invention conceme done Egalement une proteine de fusion peptide de 
transit/HGA oxydase, peptide de transit/HGAH ou peptide de trasit/HGAC, la sequence 
30 du peptide de transit etant definie prScedemment, en particulier la sequence du peptide 
de transit optimise tel que decrit dans la demande de brevet EP 508 909. 

De manidre prefSrentielle, la sequence de regulation promotrice est choisie parmi les 
sequence de regulation promotrice permettant une expression constitutive de la 
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sequence codante. ILs'agira en particulier des sequences des promoteurs du CaMV 35S, 
du CsVMV, de Tacrine de rizou d'histone. 

On peut egalement choisir d'exprimer les sequences codantes selon 1'invention a un 
niveau d'expression voisin du niveau d'expressidn du gene que 1'on cherche a 
5 contourner. On pourxa employer dans la cassette d'expression selon 1'invention une 
sequence de regulation promotrice choisie parmi les sequences de regulation 
promotrices d'HPPD de plantes. 

Pour V expression des trois en2ymes HPP oxydase, HGAH et HGAC dans une meme 
plante, on pourra choisir les cassettes d'expression des sequences codantes 
10 eorrespondantes, des sequences de regulation promotrices differentes presentant des 
profils d'expression differents, par leur force et/ou leur localisation dans les differents 
organes fonctionnels de la plante. 

On pourra choisir des sequences de regulation promotrice permettant un gradient 
d'expression HGAOHGAH>HPP oxydase ou inversement. 
15 Pour l'expression de l'HPP oxydase, de l'HGAH et de l'HGAC, la sequence de 
regulation promotrice est avantageusement choisie parmi le groupe comprenant les 
promoteurs d'HPPD de plante, d'histone H3 ou H4, notamment d'Arabidopsis ou de 
mais, en particulier ceux decrits dans la demande de brevet EP 507 698, de SSU de 
RuBisCO de plante, en particulier de tournesol ou de mais comme decrit dans la 
20 demande de brevet WO 99/25842, du CaMV 35S ou du CsVMV, et leurs combinaisons, 
en particulier les promoteurs hybrides histone/35S tels que decrits dans les exemples de 
la demande de brevet EP 507 698. Pour une expression dans les plantes 
monocotyledones, ces sequences de regulation promotrices seront avantageusement 
associees avecle premier mtron de l'actmede riz. 
25 Selon un mode de realisation de 1'invention, la cassette d'expression codant pour 
une HPP oxydase comprend un promoteur d'histone, une sequence codant pour une 
HPP oxydase et un terminateur d'histone (Figure 12 ; SEQ ID NO 15). 

Selon un autre mode de reahsation de 1'invention, la cassette d'expression codant 
pour une HP AH comprend un promoteur CaMV 35S, une sequence codant pour une 
30 HPAHetun teiminateurNOS (Figure 11 ; SEQ ID NO 17). 

Selon un autre mode de realisation de 1'invention, la cassette d'expression codant 
pour une HPAC comprend un promoteur CsVMV, une sequence codant pour une HPAC 
et un terminateur NOS (Figure 10 ; SEQ ID NO 19). 
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Vecteurs : 

La prfeente invention concerne egalement un vecteur de clonage et/ou d' expression 
comprenant au moins une cassette d'expression selon Finvention. 

Selon un premier mode de realisation de Finvention, le vecteur comprend une seule 
5- wl des cassettes d'expression selon Finvention choisie parmi les cassettes comprenant une 
sequence codante pour une HPP oxydase, une HGAH ou HGAC telles que d6finies 
prSc&Iemment. 

Selon un deuxieme mode de realisation de r invention, le vecteur comprend deux 
cassettes d'expression selon Finvention choisies parmi les cassettes comprenant une 
10 sequence codante pour une HPP oxydase, une HGAH ou HGAC telles -que definies 
precedemment associees deux a deux dans un meme vecteur : HPP oxydase et HGAH, 
HPP oxydase et HGAC, HGAH et HGAC. 

Un vecteur comprenant une cassette d'expression codant pour FHPAH etune autre 
codant pour FHPAC peut comprendre la combinaison des deux cassettes d'expression 
15 definies precedemment (SEQ ID NO 17 et 19). Une telle cassette d'expression est 
representee par la Figure 13 et la SEQ ID NO 21. 

Selon un troisieme mode de realisation de Finvention, le vecteur comprend trois 
cassettes d'expression selon Finvention, une premiere cassette d'expression de FHPP 
oxydase, une deuxieme cassette d'expression de FHGAH et une troisieme cassette 
20 d'expression de FHGAC. Une telle cassette d'expression peut comprendre la 
combinaison des trois cassettes definies prec&lement (SEQ ID NO 15, 17 et 19). Un tel 
vecteur est representee sur la figure 14 et la SEQ ED NO 22. 

Les vecteurs selon Finvention tels que definis ci-dessus peuvent egalement 
comprendre des cassettes d'expression d'autres proteines ou peptides d'interet. 
25 Lorsque le vecteur comprend plusieurs cassettes d'expression, ces deinieres peuvent 
prendre diffgrentes orientations deux a deux Fune par rapport h Fautre, colineaires, 
divergentes ou convergentes. 

Les cassettes d'expression d'autres proteines ou peptides d'interet comprennent une 
sequence d'acide nucleique codant pour des prolines ou peptides d'int&St dififerents de 
30 FHPP oxydase, de FHGAH et de FHGAC definis ci-dessus. 

II peut s'agir de sequences d'un gene codant pour un marqueur de selection comme 
d'un gene conf erant k la plante transformee de nouvelles propri6tes agronomiques, ou 
d'un gene d'am61ioration de la quality agronomique de la plante transformee. 
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Marqueurs de Selection 
Parmi les genes codant pour des marqueurs de selection, on peut titer les genes de 
resistance aux antibiotiques, les genes de tolerance aux , herbicidel (bialaphos, 
glyphosate ou isoxazoles), des genes codant pour des enzymes rapporteurs fecilement 
5 identifiables comme l'enzyme GUS, des genes codant pour des pigments ou des 
enzymes regulant la production de pigments dans les cellules transformees. De tels 
genes marqueurs de selection sont notamment decrits dans les demandes de brevet EP 
242 236, EP 242 246, GB 2 197 653, WO 91/02071, WO 95/06128, WO 96/38567 ou 
WO 97/04103. 
10 Genes d'interSt 

Parmi les genes conferant de nouvelles proprietes agronomiques aux plantes 
transformees, on peut titer les genes conferant une tolerance a certains herbicides, ceux 
conferant une resistance a certains insectes, ceux conferant une tolerance a certaines 
maladies, etc. De tels genes sont notamment decrits dans les demandes de brevet WO 
15 91/02071 et WO 95/06128. 

Tolerance herbicide 

La presente invention est particulierement appropriee pour l'expression de genes 
conferant une tolerance a certains herbicides aux cellules vegetales et aux plantes 
monocotyledones transformees. Parmi les genes conferant une tolerance a certains 

20 herbicides, on peut titer le gene Bar conferant une tolerance au bialaphos, le gene 
codant pour une EPSPS appropriee conferant une resistance aux herbicides ayant 
l'EPSPS comme cible comme le glyphosate et ses sels (US 4,535,060, US 4,769,061, 
US 5,094,945, US 4,940,835, US 5,188,642, US 4,971,908, US 5,145,783, US 
5,310,667, US 5,312,910, US 5,627,061, US 5,633,435, FR 2 736 926), le gene codant 

25 pour la glyphosate oxydoreductase (US 5,463,175), ou encore un gene codant pour une 
HPPD conferant une tolerance aux herbicides ayant pour cible l'HPPD comme les 
isoxazoles, notamment l'isoxafutole (FR 95 06800, FR 95 13570), les dicetonitriles (EP 
496 630, EP 496 631) ou les tricetones, notamment la sulcotrione (EP 625 505, EP 625 
508, US 5,506,195). De tels genes codant pour une HPPD conferant une tolerance aux 

30 herbicides ayant pour cible l'HPPD sont decrits dans la demande de brevet WO 
96/38567. 

Parmi les genes codant pour une EPSPS appropriee conferant une resistance aux 
herbicides ayant l'EPSPS comme cible, on citera plus particuherement le gene codant 
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pour une EPSPSLv6g6taIe, en particulier demais, pr^sentant deux mutations 102 et 106, 
decrit dans la demande de brevet FR 2 736 926, denommd ci-dessous EPSPS double 
mutant, ou encore le gene codant pour une EPSPS isolee d'Agrobacterium d6crit par Ies 
sequences ID 2 et ID 3 du brevet US 5,633,435, denomme ci-dessous GP4. 
5 Parmi les genes codant pour une HPPD conferant une tolerance aux herbicides 

ayant pour cible l'HPPD, on citera plus particulierement l'HPPD de Pseudomonas et 
celle d'Arabidopsis, decrites dans la demande de brevet WO 96/38567. 

Dans les cas des genes codant pour EPSPS ou HPPD, et plus particulierement 
pour les genes ci-dessus, la sequence codant pour ces enzymes est avantageusement 
10 pr6c&lee par une sequence codant pour un peptide de transit, en particulier pour le 
peptide de transit dit peptide de transit optimise dterit dans les brevets US 5,510,471 ou 
US 5,633,448. 

Resistance aux Insectes 
Parmi les proteines d'interSt conferant de nouvelles propri&es de resistance aux 
15 insectes, on citera plus particulierement les proteines Bt largement decrites dans la 
litterature et bien connues de Thomme du metier. On citera aussi les prolines extraites 
de bacteries comme Photorabdus (WO 97/1 7432 & WO 98/08932). 
Resistance aux Maladies 
Parmi les proteines ou peptides d'int<§ret conferant de nouvelles proprietes de 
20 resistance aux maladies on citera notamment les chitinases, les glucanases, Toxalate 
oxydase, toutes ces proteines et leurs sequences codantes 6tant largement decrites dans 
la litterature, ou encore les peptides antibact6rien$ et/ou antifongiques, en particulier les 
peptides de moins de 100 acides amines riches en cysteines comme les thionines ou 
defensines de plantes, et plus particulierement les peptides lytiques de toutes origines 
25 comprenant un ou plusieurs ponts disulfures entre les cysteines et des regions 
comprenant des acides amines basiques, notamment les peptides lytiques suivants : 
Tandroctonine (WO 97/30082 et PCT/FR98/01814, d£pos6e le 18 aofit 1998) ou la 
drosomicine (PCTYFR98/01462, dSposee le 8 juillet 1998). 

Selon un mode particulier de realisation de Finvention, la proline ou peptide 
30 d'interet est choisi parmi les peptides eliciteurs fongiques, en particulier les 61icitines 
(Kamoun & al., 1993 ; Panabieres & al., 1995). 
Modification de la qualit6 
On peut 6galement citer les genes modifiant la constitution des plantes modifiees, en 
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particulier la teneur-et la qualite de certains acides gras essentiels (EP 666 918) ou 
encore la teneur et la qualite des proteines, en paiticuliers dans les feuilles et/ou les 
graines desdites plantes. On citera en particulier les genes codant pour des proteines 
enrichies en acides amines soufres (Korit, AA & al., Eur. J. Biochem. (1991) 195, 329- 
5 334 ; WO 98/20133 ; WO 97/41239 ; WO 95/31554 ; WO 94/20828 ; WO 92/14822). 
Ces proteines enrichies en acides amines soufres auront egalement pour fonction de 
pieger et stocker la cysteine et/ou la methionine excedentaire, permettant d'eviter les 
problemes eventuels de toxicity lies a une surproduction de ces acides amines soufres en 
les piegeant On peut citer egalement des genes codant pour des peptides riches en 
10 acides amines soufres et plus particulierement en cysteines, les dits peptides ayant 
egalement une activite antibacterienne et/ou antifongique. On citera plus 
particulierement les defensines de plantes, de meme que les peptides lytiques de toute 
origine, et plus particulierement les peptides lytiques suivants : l'androctonine (WO 
97/30082 et PCT/FR98/01814, deposee le 18 aout 1998) ou la drosomicine 
15 (PCT/FR98/01462,d6poseele8juilletl998. 

Cellules vegetales et plantes transgeniq nes 

La presente invention concerne 6galement des cellules v6g6tales et des plantes 
tonsformees comprenant au moins une cassette d'expression d'une HPP oxydase, d'une 
HGAH ou d'une HGAC telles que definies ci-dessus. 
20 Selon un premier mode de realisation de Finvention, les cellules vegetales ou les 
plantes comprennent une seule des cassettes d'expression selon l'invention choisie 
parmi les cassettes comprenant une sequence codante pour une HPP oxydase, une 
HGAH ou HGAC teUes que d6fmies precedemment 

Selon un deuxieme mode de realisation de l'invention, les cellules vegetales ou les 
25 plantes comprennent deux cassettes d'expression selon l'invention cnoisies parmi les 
cassettes comprenant une sequence codante pour une HPP oxydase, une HGAH ou 
HGAC telles que definies precedemment associees deux a deux dans un meme vecteur : 
HPP oxydase et HGAH, HPP oxydase et HGAC, HGAH et HGAC. 

Selon un troisieme mode de realisation de l'invention, les cellules vegetales ou les 
30 plantes comprennent trois cassettes d'expression selon l'invention, une premiere 
cassette d'expression de l'HPP oxydase, une deuxieme cassette d'expression de 
l'HGAH et une troisieme cassette d'expression de l'HGAC. 

Les cellules vegetales ou les plantes selon l'invention tellees que definis ci-dessus 
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peuvent 6galementxomprendre des cassettes d'expression d'autres protdines ou peptides 

d'interet definies pr£c6demment 

De maniere preferentielle, les cassettes d'expression sont integr^es de mani&re stable 

dans le genome des cellules vegetales ou des plantes. Plus pref&rentiellement, les 
5 plantes selon Pinvention sont fertiles, les cassettes d'expression selon Pinvention 6tant 

transferees a leur descendance. 

La presente invention concerne egalement des graines de plantes transgeniques ci- 

dessus, lesquelles graines comprennent une cassette d'expression selon Pinvention 

codant pour une HPP oxydase, une HGAH ou une HGAC. 
10 Les diff&rentes cassettes d'expression dans les plantes transformSes selon 

Pinvention peuvent provenir soit de la meme plante transformee parente, et dans ce cas 

la plante est issue d'un seul proc6de de transformation/regeneration avec les difiterentes 

cassettes d' expression contenues dans un meme vecteur ou par co-transformation au 

mpyen de plusieurs vecteurs. Elle peut egalement etre obtenue par le croisement de 
15 plantes parentes contenant chacune au moins une cassette d'expression selon 

Pinvention. 

Transformation des cellules vegetales et des plantes 

L'invention a encore pour objet un precede de transformation des des cellules 
vegetales et des plantes par introduction d'au moins une sequence d'acide nucleique ou 

20 une cassette d'expression selon Pinvention telles que definies pr6c6demment, 
transformation qui peut Stre obtenue par tout moyen connu approprie, amplement d6crit 
dans la litterature sp^cialisee et notamment les references citees dans la prSsente 
demande, plus particulferement par le vecteur selon Pinvention. 

Une serie de m&hodes consiste a bombarder des cellules, des protoplastes ou des 

25 tissus avec des particules auxquelles sont accrochSes les sequences d r ADN. Une autre 
s6rie de methodes consiste h utiliser comme moyen de transfert dans la plante un gdne 
chimere insere dans un plasmide Ti d ! Agrobacterium tumefaciens ou Ri 
d'Agrobacterium rhizogenes. D'autres methodes peuvent etre utilisees telles que la 
micro-injection ou Telectroporation, ou encore la precipitation directe au moyen de 

30 PEG. LTiomme du metier fera le choix de la methode appropriee en fonction de la 
nature de Porganisme h6te, en particulier de la cellule vegetale ou de la plante. 

Lorsque Pon souhaite introduire plusieurs sequences d'acide nucleique ou cassettes 
d'expression, on peut le faire au moyen d'un seul vecteur selon Pinvention comprenant 
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les different** cassettes d'expression. Elles peuvent egalement etre introduites dans 
l'organisme h6te par co-transformation an moyen de plusieurs vecteurs, chacun 
comprenant au moins une cassette d'expression. 

D'une maniere generate, les plantes transgeniques selon l'invention sont obtenues 
5 par transformation de ceUuIes veg6tales pnis generation dW plante, de prefere^ 
fertile a partir de la cellnle transformer La regeneration est obtenue par tout precede 
approprie qui depend de la nature de l'espece, comme par exemple decrit dans les 
references ci-dessus. Pour les proves de transformation des cellules vegetales et de 
regeneration des plantes, on citera notamment les brevets et demandes de brevet 
10 suivants: US 4,459,355, US 4,536,475, US 5,464,763, US 5,177,010, US 5,187,073, BP 
267,159, EP 604 662, BP 672 752, US 4,945,050, US 5,036,006, US 5,100,792, US 
5371,014, US 5,478,744, US 5,179,022, US 5,565,346, US 5,484,956, US 5,508,468, 
US 5,538,877, US 5,554,798, US 5,489,520, US 5,510,318, US 5,204,253, US 
5,405,765, EP 442 174, EP 486 233, EP 486 234, EP 539 563, EP 674 725,' WO 
15 91/02071 et WO 95/06128. 
Desherbage selecrif 

L'invention a aussi pour objet un procede de desherbage selectif de plantes, 
notamment de cultures, a 1'aide d'un inhibiteur de 1THPPD notamment un herbicide^ 
d6finit auparavant, caract6rise en ce qu'on applique cet herbicide sur des plantes 
20 transformees selon l'invention, tant en presemis, en prelevee qu'en postlevee de la 
culture. 

La presente invention concerne egalement un procede de contr61e des mauvaises 
herbes dans une surface d'un champ comprenant des graines on des plantes 
transformees selon l'invention, lequel procede comprend 1'appHcation dans la dite 
25 surface du champ d'une dose toxique pour les dites mauvaises herbes d'un herbicide 
inhibiteur d'HPPD, sans toutefois affecter de maniere substantieUe les graines on 
plantes transformee selon l'invention. 

La presente invention concerne egalement un procede de culture des plantes 
transformees selon l'invention lequel procede comprend le semis des graines des dites 
30 plantes transformees dans une surface d'un champ approprie pour la culture des dites 
plantes, Implication sur la dite surface du dit champ une dose toxique pour les 
mauvaises herbes d'un herbicide ayant pour cible l'HPPD defini ci-dessus en cas de 
presence de mauvaises herbes, sans affecter de maniere substantieUe les dites graines on 
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les dites plantes.transformdes, puis la r6colte des plantes cultivSes lorsqu'elles arrivent a 
la maturite souhait£e et 6ventuellement la separation des graines des plantes recolt&s. 

Par « sans affecter de maniere substantielle les dites graines ou les dites plantes 
transformees », on entend selon Tinvention que les plantes transformees selon 
5 Tinvention soumises a une application d'une dose d'herbicide toxique pour les 
mauvaises herbes, presentent une phytotoxicite legere ou nulle. Par dose toxique pour 
les mauvaises herbes, on entend selon Tinvention une dose d'application de Therbicide 
pour laquelle les mauvaises herbes sont tu£es* Par phototoxicity l£gere on entend selon 
Tinvention un pourcentage de feuilles blanchies inferieur a 25%, preferentiellement 

10 inferieur a 10%, plus preferentiellement inferieur a 5%. II est entendu egalement selon 
la presente invention que T application de la meme dose toxique sur une plante 
autrement comparable non transform6e, c'est a dire ne comprenant pas au moins une 
cassette d'expression selon Tinvention, conduirait a observer sur ladite plante des 
symptomes de phytotoxicite supperieurs a ceux observes pour la plante transformee 

1 5 selon Tinvention. 

Dans les deux procedes ci-dessus, T application de Therbicide ayant pour cible 
THPPD peut etre faite selon Tinvention, tant en presemis, en pr61ev6e qu'en postlev6e 
de la culture. 

Par herbicide au sens de la presente invention on entend une matiere active herbicide 
20 seule ou associee k un additif qui modifie son efficacite comme par exemple un agent 
augmentant Factivite (synergiste) ou limitant Tactivite (en anglais safener). Les 
herbicides inhibiteurs d'HPPD sont en particulier definis auparavant. Bien entendu, 
pour leur application pratique, les herbicides ci-dessus sont associee de maniere en soi 
connue aux adjuvants de formulations utilises habituellement en agrochimie 
25 Lorsque la plante transformee selon Tinvention comprend un autre gene de tolerance 
a un autre herbicide (comme par exemple un gene codant pour une EPSPS mutee ou non 
conferant a la plante une tolerance au glyphosate), ou lorsque la plante transformee est 
naturellement insensible a un autre herbicides, le procede selon Tinvention peut 
comprendre Tapplication simultan6e ou decalee dans le temps d'un inhibiteur d'HPPD 
30 en association avec ledit herbicide, par exemple le glyphosate. 

Les difierents aspects de Tinvention seront mieux compris a Taide des exemples 
exp6rimentaux ci-dessous. 

Toutes les m&hodes ou operations decrites ci-dessous dans ces exemples sont 
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donnees a titre d'exemples et correspondent a un choix, effectu6 parrni les differentes 
methodes disponibles pour parvenir au mgme resultat. Ce choix n'a aucune incidence sin- 
la quality du resultat et par consequent, toute methode adaptee peut eui utilisee par 
1-homme de 1'art pour parvenir au meme resultat. La plupart des methodes d'ingenierie 
5 des fragments d'ADN sont decrites dans Coligan et ah (1995) s Ausubel et ah (1995) ; 
Maniatis et ah (1 982), Sambrook et ah 

Les references bibUograpbiques citees precedement sont integrees par reference 
a la presente demande de brevet, en particulier les references bibhographiques 
definissant les sequences d'acide nucleique codant pour des HPPD natives, chimeres ou 
10 mutees, eventueUementcornbinees avec un peptide signal ou peptide de transit " 

Exemple I : IDENTIFICATION DU GENE CODANT L'HPP OXYDASE 
D'ARTHROBA CTER GLOBIFORMIS 

L'HPP oxydase (HPPO) convertit I'HPP en 4-HPA par une reaction de 
decarboxylation. Cette enzyme catalyse done la premiere activite enzymatique 
15 necessaire pour la construction de la voie metabolique contournant l'HPPD. L'activite 
HPP oxydase a ete caracterisee dans des extraits bruts de Rhodococcus erythropolis SI 
(Suemori et ah, 1995) ou dans un extrait partiellement purifiee d'Arthrobacter 
globiformis (Blakley, 1977). A notre connaissance, la proline n'a pas ete purifiee. Afin 
de pouvoir introduire cette activite enzymatique dans la plante, il est necessaire d'en 
identifier le gene. Differentes approches sont envisageables: (1) la mutagenese 
insertionnelle et done Identification du gene par la perte de l'activite enzymatique, (2) 
la complementation fonctionnelle d'un nucroorganisme en utilisant une banque 
genomique, (3) la purification de la proteine pour remonter a la sequence nucleique. 
Les trois approches furent utilisees. La complementation fonctionneDe et la mutagenese 
25 insertionneUe seront peu developpees, ces techniques n'ayant pas permis d'identifier le 
gene HPPO. 

1.1 Materiels et Methodes 
1.1.1- Les conditions de culture 

30 1.1.1.1- Les milieux riches 

Le milieu Luria-Bertani (LB; commercialism par BiolOl) est utilise pour cultiver 
les bacteries (R coli, P. fluorescent) lors des experiences de biologie moleculaire. Pour 
la culture d'A. globiformis on preferera le milieu Columbia-ANC enrichi avec 5%de 
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sang de mouton (BioM£rieux). Ce milieu riche contient deux antibiotiques (acide 
nalidixique et colimycine) inhibiteurs des gennes k Gram hSgatif. Bien que les trois 
bacteries poussent sur milieu riche a 37°^ on cultive en general A. globiformis et P. 
fluoresce™ a29°C. 
5 LI .1 .2- Le milieu de culture MAS 

Le milieu de culture decrit par Blakley (1977) precipite, il faut done le filtrer 
avant utilisation. Nous avons change progressivement le milieu afin d'atteindre un 
milieu " minimal " optimal. Les facteurs consideres sont la vitesse de croissance d y A. 
globiformis et 1'activite enzymatique de IUPPO. Le milieu retenu QA^S) est un milieu 
10 M9 (Maniatis et ah, 1982) legSrement modifier NazHPO,, 12 H 2 0 (6 g/L); KH 2 P0 4 (3 
g/L); NH 4 C1 (1 g/L); NaCl (0.5 g/L); CaCl 2 (6 mg/L); FeS0 4 7 H 2 0 (6 mg/L); extrait de 
levure (20 mg/L); et enfin le substrat (HPP ou tyrosine Ou citrate) k la concentration 
lg/L. Le milieu est autoclave. Avant utilisation, 1 mL de MgS0 4 1 M sterile est ajoute 
par litre de milieu. 

15 Ce milieu minimum est aussi utilise pour cultiver P. fluorescens. 

1.1.2- Construction d'une banque genomique d'Arthrobacter globiformis 
II n'existe pas de technique fiable permettant de faire une banque de cDNA 
bact&iens complets. Nous avons done decide de creer une banque genomique 
d'Artkrobacter globiformis. Pour la r6aliser, nous choisissons le systeme cosmidique. 
20 La banque cosmidique fut realisSe pour les experiences de complementation 
fonctionnelle, puis fut utilisee plus tard pour rechercher le ou les cosmides contenant le 
gene/z/>pO. 

1.1.2.1- Le vecteur cosmidique pLAFRS 

1.1.2.1.1- Description du vecteur 

25 Nous choisissons le vecteur cosmidique conjugatif pLAFR-5 (Keen et aL, 1988) 

qui peut recevoir un insert d'environ 20 kb. Pourvu d'une origine de transfert et d'une 
origine de replication a large spectre d'hote a Gram negatif, il peut etre transmis k 
d'autres genres bacteriens par conjugaison tri-parentale ce qui peut etre utile pour tester 
la complementation fonctionnelle chez difierents genres bacteriens. II confere une 

30 resistance a la tetracycline. 

1. 1 .2. 1 .2- Preparation du vecteur 

Le plasmide pLAFR-5 est purifie par un protocole de lyse alcaline (Maniatis et 
aL, 1982), traite a la RNAse puis digere par Bam HI et Sea I. La digestion par Bam HI 
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permet d'ouvrir lejsjte dans lequel seront "ligues" les inserts d'ADN genomique <hger<§ 
par SaiAA. La digestion par Sea I permet de liberer les sites cos qui permettent 
l'encapsidation. Apres extraction phenolique puis cWoroformique, l'ADN est precipite a 
l'ethanol. L'ADN sec est solubilise dans l'eau. Le vecteur ainsi prepare est conserve a - 
5 20°C. 

1.1.2.1- Preparation de l'ADN genomique d'A. globiformis 
Une culture de 24 heures (200 mL, 180 rpm, 29°C) realisee dans le milieu (200 
mL) decrit par Blakley (1977) est centrifugee a 3000 g a 4°C pendant 15 minutes. Le 
culot cellulaire, repris par 10 mL de solution de lyse (TE pH 8 ; 0,5 % SDS; 1 mg 

10 proteinase K), est incube a 37°C au bain-marie avec une agitation douce toutes les 20 
minutes. Au bout de 90 minutes, la suspension de cellules lysees est versee dans un tube 
JA30 en polypropylene. On ajoute alors 10 mL de phenol/ chloroforme/ isoamylalcool 
(25/24/1) puis on centrifuge a 6 000 g pendant 15 minutes a 4°C. Le surnageant est 
alors transfer^ dans un nouveau tube JA20 auquel on ajoute 1,8 mL d'acetate 

15 d'ammonium 10 M et 10 mL d'isopropanol. Apres centrifugation a 20 000 g pendant 20 
minutes a 4°C, le culot est rince a l'ethanol 70 %. Le culot sec est repris avec 1 mL TE 
pH 8 puis transfer^ dans un tube Eppendorf de 2 mL auquel 10 pL de RNAse (10 
mgjnL-') sont additionnes. Apres 30 min a 37°C, 800 pL de phenol/ chloroforme/ 
isoamylalcool sont rajoutes. Apres centrifugation, le surnageant est transfer* dans un 

20 nouveau tube Eppendorf et extrait avec 0,8 mL de chloroforme. Le surnageant est alors 
transfere dans un dernier tube Eppendorf auquel 200 uL d'acetate d'ammonium 10 M et 
800 uL d'isopropanol sont ajoutes. Apres centrifugation, le culot est rince a l'ethanol 
70% puis, une fois sec, repris dans 500 uL d'eau. L'ADN genomique est alors stocks a - 
20°C. 

25 1.1.23- Digestion menagee de l'ADN genomique &' A. globiformis 

Seuls les cosmides faisant 40-45 kb peuvent etre encapsides. Le vecteur faisant 
21,5 kb, les inserts d'ADN genomique d'A. globiformis doivent avoir une taille 
comprise entre 19 et 22 kb. Ces fragments sont obtenus en realisant une digestion 
menagee de l'ADN g6nomique d'Arthrobacter globiformis. Pom definir les conditions 

30 optimales de la digestion menagee nous realisons des digestions de l'ADN genomique 
d'A globiformis avec des quantites variables d'enzyme de restriction Sou 3 A. H apparait 
que la meilleure condition de digestion utilise 0,08 unite enzymatique Sou 3A pendant 
30 minutes a 37°C. L'ADN genomique ainsi digere presente une taille comprise entre 



BNSDOC1D: <WO 0236787A2_I. > 



WO 02/36787 24 PCT/FR01/03364 

15 et 22 kb. L'AI>N^6nomique ainsi digere est extrait au phenol puis au chloroforme et 
enfin pr£cipit6 a PethanoL 

LI. 2.4- Ligation de FADN genomique d'A globiformis dans le vecteur 

cosmidique 

5 La reaction de ligation se fait dans un volume final de 1 0 ^iL, contenant 500 ng 

de pLAFR-5 digere par Bam HI et Sea I, 650 ng d'ADN gSnomique dig6r6 par Sau 3 A, 
320 unites de T 4 DNA ligase (N.E.B.) et 5 mM d'ATP. La ligation se d&oule k 12°C 
pendant la nuit (environ 16 heures). Les 5 mM d' ATP permettent d'eviter les ligations 
entre les extremites franches (Sea I) (Feretti & Sgaramella, 1981) de telle sorte que les 
10 dimeres de vecteurs n'ayant pas d'insert ne puissent pas s'encapsider dans la tete des 
phages X. 

LI .2.5- Encapsidation des cosmides et amplification de la banque 
cosmidique 

L'encapsidation des cosmides, realisee en utilisant le kit GIGAPACK II XL 

15 (Stratagene) en respectant les instructions du fournisseur, assure une efficacite de 
transfection superieure a celles obtenues avec les techniques classiques de 
transformation. Pour amplifier la banque cosmidique, Keen et al. (1988) conseillent 
d'utiliser les Escherichia coli DH-1 et HB101. En effet, lorsque ces souches sont 
cultiv£es sur maltose, elles produisent une proteine membranaire qui permet une 

20 meilleure fixation du phage et done une transfection plus efficace des cosmides. La 
banque, amplifi6e en suivant les recommandations de Stratagene, est conservee a — 
80°C. Pour ^valuer la banque cosmidique, PADN plasmidique isole d'une trentaine de 
clone est diger6 par Apa I ou Eco RL Les profils de restriction sont observes sur gel 
d'agarose k 0,8%. 

25 1.13- Purification de PHPP oxydase 

L 1.3.1- Test colorimetrique de Tactivite HPP oxydase 
Afin de pouvoir contr61er les etapes de purification, PactivitS HPP oxydase est 
suivie en utilisant le test colorimetrique d^crit par Blakley (1977). La reaction 
enzymatique est stopple par Tajout de 2,4 dinitrophenylhydrazine (2,4-DNPH), en 

30 solution dans FHC1 2 M. La 2,4-DNPH reagit avec la fonction c&one en alpha d'une 
fonction carboxylique (ex : FHPP). II se forme ainsi une hydrazone que Ton peut reveler 
en alcalinisant le milieu. Lorsque PHPP est convertit en totalite en 4-HPA pendant la 
reaction enzymatique, Thydrazone ne peut pas se former, on obtient done, en milieu 
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basique, la couleur jaune caracteristique de la 2,4-DHPA Si l'HPP tfest pas enticement 
convertit en 4-HPA lors de la reaction enzymatique, la formation d-hydrazone est 
possible. Ces hydrazones prennent une couleur brune en milieu basique! Une variation 
de coloration entre ces deux extremes est obtenue en fonction de la quantity d'HPP 
consomme. Les mesures d'absorption sont faites a 445 ou 450 nm. Afin de rendre ce test 
plus focilement manipulable, nous i'avons adapte au format microplaque a 96 puits. Le 
melange reactionnel comprend GSH (900 uM); HPP (135 uM); TPP (1,8 mM); MgCl 2 
(4,5 mM); FAD (4 uM); tampon phosphate de potassium (90 mM) pH 7,4. Le melange 
est conserve sur glace. Dans chaque puits on depose 50 pX de la fraction a tester et 1 50 
uL de melange reactionnel. Apres 20 min a 30°G, la reaction enzymatique est stoppee 
avec 13 uL de solution 2,4-DNPH (0.1% dans HC1 2 M). Laisser reagir 20 min a 
temperature ambiante. On revele la formation d'hydrazOne en ajoutant 13 uL de 
solution NaOH 10 M. Pour realiser la gamme 6talon, des melanges reactionnels avec 
des concentrations variables d'HPP sont prepares. Les 50 uL de fraction proteique sont 
15 remplaces par 50 uL de tampon d'extraction de laproteine. La courbe etalon est reatisfe 
pour chaque nouvelle solution de 2,4-DNPH (la solution de 2,4-DNPH est stable 6 mois 
a Pobscurite). L'avantage de ce test est sa rapidity sa shnplicite, mais il a le d6faut de 
mesurer une disparition de substrat et non pas une apparition de produit En outre, la 
possibilite d'avoir des faux positifs existe : une activite tyrosine amino-transferase 
20 donnera le meme resultat que Pactrvitd de l'HPPO. En effet, dans les deux cas, la 
fonction cetone a disparu. Nous avons done develop^ une m6thode HPLC rapide et 
sensible qui permette de confirmer la production de 4-HPA 
1.1.3.2- Test d'activitd analyse par HPLC 
Une metiiode HPLC a 6t6 mise au point en utilisant une petite eolonne 
Spherisorb ODS2 50 x 4,6 mm et de granulomere 3 ami La chromatographie est 
reatisee en isocratique A: 90%; B: 10% (ou tampon A: H 2 0 0,1% TFA et tampon B: 
ac^tonitrile), debit 0,8 mL-mm 1 et l'elution est suivie a 230 nm. Dans ces conditions, il 
est possible de separer le 4-HPA, l'HGA, le 3,4-DHPA et l'HPP en 5 minutes apres 
l'injection. La eolonne a ete realisee a fa9on par Merck. 
30 1.1.3.3- Purification de la proteme 

Lors de la mise au point de ce protocole, un souci de simplicity a et6 recherche 

1.1.3.3.1- Tests preliminaires 
Les tests prelhninaires ont pour but de determiner l'influence de composes 
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(NaCl, KC1, propanol-1, ethylene glycol, etc ,..) et du pH sur Factivite enzymatique. 
Les reactions sont realisees avec des extraits bruts d 9 A. globiformis cultivS sur milieu 
M^S contenant de la tyrosine comme seule source de carbone (M^^-tyrosine). Le 
compose h tester est ajoute dans le milieu r£actionneL Pour mesurer Tinfluence du pH 
5 sur Tactivite enzymatique de 1'HPPO, diffiSrents tampons phosphate sont realises. 
LI 3.3*2- Protocole de purification 
La souche &*Arthrobacter globiformis est 6tal6e sur milieu g<SIose LB ou sur 
milieu gelos6 Columbia- ANC. Apr&s 16 heures de culture a 29°C, une colonie est 
pr&evee et ensemencEe dans 5 mL de milieu LB, en croissance pendant 8 heures a 

10 29°C, 1 80 rpm. 50 ^xL de cette preculture sont alors inocul6s dans 1,5 L de-milieu MAg- 
Tyrosine ou M^S-HPP, la culture est alors realises a 29°C, 180 rpm, dans des 
Erlenmeyer a ailettes (Belco). Apres 48 heures de culture, lfes cellules sont collectees par 
centrifugation a 5 000 g pendant 15 minutes a 4°C. Les cellules sont remises en 
suspension dans du tampon Tris-HCl 50 mM pH 7,4 puis centrifugees comme 

15 precedemment Le culot est repris dans 2 mL de tampon Tris-HCl 50 mM pH 7,4. Les 
cellules sont soniquees (Vibra Cell, Sonic Materials INC., Connecticut, USA) pendant 
15 minutes, puissance 4, pulse de 30%, dans la glace fondante. Les debris insolubles 
sont elimines par une centrifugation de 25 min a 20 000 g, 4°C. Le surnageant est 
recuperS, il constitue Textrait brut". II peut etre congele dans Pazote liquide puis 

20 conserve a -80°C (pendant 6 mois sans perte apparente d'activite). L'extrait brut est 
charge, sans dessalage prealable, sur une colonne echangeuse faible d' anions 
'EMD/DEAE 650 S' (Merck) equilibree en tampan phosphate 50 mM pH 7^4. L'elution 
de Factivite enzymatique est obtenue en appliquant un gradient de concentration de 
NaCl (en solution dans un tampon phosphate 50 mM pH 7,4. Les fractions contenant 

25 Factivite enzymatique sont rassembtees. La solution proteique obtenue est diluee d'un 
facteur 2,7 avec du tampon phosphate 50 mM pH 7,4. Les prolines sont alors chargees 
sur une colonne (XK16, Pharmacia) echangeuse forte d'anions 'source Q' (30 mL, 
Pharmacia) pr<Salablement Equilibree avec un tampon phosphate 50 mM pH 7,4. Les 
fractions proteiques interessantes, identifiers par Factivite enzymatique, sont 

30 rassemblees puis concentrees sur membrane UVIKON 10 kDa. L'extrait prot6ique 
resultant est alors dessate par la technique de gel-filtration en utilisant une colonne 
'PD10* (Pharmacia) 6quilibr6e en tampon phosphate 10 mM pH 7,4 et elu6 avec ce 
meme tampon. Les prolines sont alors deposees sur une colonne (XK9/1 5; Pharmacia) 
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dTiydroxyapatite (2 ,-mL; Hydroxyapatite DNA grade Bio-Gel®HTP gel; Bio-Rad) 
equilibree avec 10 mM tampon phosphate pH 7,4. On &ue l'activite enzymatique en 
appliquant uh gradient phosphate. Les fractions contenant l'activite "enzymatique sont 
rassemblees et concentrees. On conserve les prolines actives lorsqtie la concentration 
5 protaqueest supeneure i 1 mg/mL enajoutantdu FAD, GSHet glycerol afin d'obtenir 
les concentrations finales suivantes : 27 uM FAD, 110 *iM GSH, 0,8% glycerol. Les 
proteines ainsi preparers peuvent Stre congelees a -80°C pendant au moins 6 mois. 

1.1.3.3.3- Dosage des proteines 

Le dosage des prolines se fait selon la methode de Bradford (1976) en utilisant 
10 la y-globuline pour standard. - 

1.1.3.3.4- Coloration des gels de prolines 

Les fractions pratiques sont analysees sur gel de polyacrylamide k 10 % selon la 
methode de Laemmli (1970). Apres migration, les proteines du gel sont colorees soit en 
utilisant la methode au Bleu de Coomassie (Chua, 1980) soit en utilisant la methode au 
15 nitrate d'argent (Schoenle er al., 1984). 

I.L4- Microsequencage proteique de I'extremite N-terminale et de peptides 
internes 

Le microsequencage de la proteine est realise en utilisant la methode d'Edman 
(Laursen, 1971). Pour obtenir les meilleurs resultats lors du sequencage, le gel est 
20 prepare le jour meme. 

1. 1 .4. 1 - Preparation dU gel d'acrylamide et son electrophorese 
Les gels (8,5%, 10% ou 12%) sont realises selon la methode de Laemmli (1970) 
en utilisant le systeme de minigels d'Hoefer®. Les proteines sont dfluees au tiers avec 
une solution 'bleu de depot denaturant' (Tris-Hei 150 mM pH 6,8; SDS 4 %; 0- 
mercaptoethanol 2% (v/v); glycerol 3,3% (v/v); bleu de Bromophenbl 0,03% qsp 10 mL 
d'eau milliQ). Apres avoir ete bouilhes 5 minutes, les proteines sont chargees sur le gel 
d'acrylamide. La migration est realisee a temperature ambiante en utilisant un tampon 
de migration denaturant (Tfis base 25 mM; glycine 250 mM; p-mercaptoethanol 
0,014% (v/v); SDS 0,1 %) et en appliquant une intensite de 15 mA par gel. 

LI .4.2- Preparatifs pour le sequencage de 1' extremite N-terminale 
Afin de pouvoir realiser le sequencage de I'extremite N-terminale, le gel est 
transfers sur membrane PVDF (PROBLOTT* - Applied Biosystems) en utilisant la 
technique de transfert semi-sec. L'electrotransfert des polypeptides se fait eh 30 minutes 
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a 300 mA avec i'appareil 'Semy Dry Electroblotter' (Bio-Rad) et dans un milieu a base 
de GAPS (tampon de transfert: CAPS 10 mM pH 1 1 ,0; methanol 1 0% (v/v)). Le tampon 
de transfert ne contient pas de glycine qui risquerait de "polluer" le s6quen£age. Aprds 
le transfert, la membrane est rinc^e quelques secondes a Peau milliQ. EUe est alors 
5 immergee quelques secondes dans une solution de coloration k base d'amido-schwarz 
(Aldrich; ref: 19,524-3). La solution est constitute de methanol 45% (v/v), d'acide ac6tique 
1% (v/v), d'amido-schwarz 0,1% (m/v) et d'eau 63,9% (v/v). Lorsque la bande 
correspondante k la proteine d'interet est visible, la membrane est rincee abondamment 
a Peau milliQ puis elle est sechee a Fair. La partie de la membrane contenant la proteine 

10 d'int£r£t (60 kDa) est dtcoupee et envoyee pour le s£quen$age. 

1. 1.4.3- Preparatife en vu du sequen?age des peptides internes 
Pour visualiser les proteines dans le gel, on utilise un protocble de coloration k 
rAmido-Schwarz legerement different de celui utilise pour colorer la membrane PVDF. 
Apres migration, le gel est fixe deux fois trente minutes avec une solution constitute de 

15 methanol 50 %, d'acide acetique 10 %, d'eau milliQ 40 %. La coloration est rtaliste 
avec une solution constitute de methanol 45 %, d'acide acetique 10 %, d'eau 45 %, 
d'Amido-Schwarz 0,003 % (p/v). Les proteines apparaissent progressivement. Lorsque 
la coloration est suffisante pour reperer la prottine, le gel est rince abondamment a Feau 
milliQ. La bande d'inttrSt est decoupee puis deshydratee au speed-vac (Savant). La 

20 bande de gel, ayant perdue environ un tiers de sa longueur, est envoye pour le 
sequen9age. Les peptides internes sont obtenus apres digestion de la proteine par 
Fendoprottase Lys-C (sequencing grade Boehfinger). La proteine dans le gel de 
polyacrylamide est digtree dans 150 \xL de tampon Tris-HCl pH 8,6 (0,1 M) contenant 
0,03% de SDS, a 35°C pendant 18 heures en presence de 0,4 fig d'endoprotease Lys-C. 

25 La proteine digeree est injectee sur colonne HPLC DEAE-C18 (diametre 1 mm); les 
peptides sont elues en utilisant un gradient d'acetonitrile (de 2 a 75 %) contenant du 
TFA a 0,1%. L'endoprottase Lys-C clive sptcifiquement les polypeptides du cdtt 
carboxylique des lysines. 

1.1.5.1- Validation theorique en utilisant le gene MndD tfArthrobacter 

30 globiformis 

Une partie (867 pb) du gene MndD est amplifit par PGR en utilisant les amorces 
'OZ-MndD-S7ir: ACGTCACCGA AGAGGATGAA AAC et 'OZ-MndD-AS1578': 
ACGGCCATTT CGGACTTTTC. La PCR est realiste en utilisant le programme suivant 
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95°C 5 min; 25 cycles: 95°C 45 sec, 56°C 45 sec; 72°C 1 min; 72°C 5 min; 4°C en 
attente. Le melange reactionnel comprend 200 a 500 uM de dNTP, 20 a 200 ng d'ADN 
cosmidique ou genomique et 100 pmol de chaque amorce dans un volume final de 50 

5 115^2- Identification par PCR d^une partie du gene codant l'HPP oxydase 

La PCR est realisee en utilisant le kit 'Advantage^-GC Genomic PCR' 
(Clontech). Ce kit comprend, entre-autres, un adjuvant a base de betaine 'GC melt* et un 
melange de polymerases thermoresistantes - principalement avec de la Thermus 
thermophilus (Tth) -. L'amplification est realisee sur 1'ADN genomique d' Arthrobacter 
10 globiformis, en utilisant la programmation suivante : 94°C 5 min; 30 cycles: 94°C 20 
sec, 60°C 30 sec, 72°C 3 min; 72°C 6 min; 4°C en attente. Les conditions reactionnelles 
sont 400 uM dNTP, 50 ng d'ADN g6nomique, 100 pmol de chaque amorce, <GC melt' 
IX, pour un volume reactionnel de 50 uL. Dans ces conditions, nous amplifions une 
bande de 937 pb que nous dehommons Z2. 
15 L'amplification par PCR peut Stre aussi realisee en utilisant la Tth d'Epicentre oii 

la Tbr {Thermus brocManus - Finnzyme). La Tbr est la seule polymerase 
thermoresistante testee a pouvoir realiser la PCR sans additifs (DMSO, glycerol, 
betaine) ; c'est en outre une enzyme de haute fidelite. 
L1.6- Criblage de la banque cosmidique 
20 Le criblage de la banque cosmidique est realise en utilisant la technique des 

sondes fioides marquees a la dioxygenine (Boehringer Mannheim, 1995). 
1.1.6.1- Preparation de la sonde Z2-Dig 
Le marquage de la sonde a la digoxygenine est faite par PCR dans un volume 
final de 50 uL, dans les conditions definies au paragraphe n.5.2, sauf pour le melange 
25 de dNTP constitue par : dUTP-Dig 90 uM; dTTP 135 ^M; dATP 225 uM; dCTP 225 
uM; dGTP 225 uM. On quantifie la sonde amplifide en deposant 3 jiL de la reaction sur 
un gel agarose a 0,8%. H apparait un leger bruit de fond, c'est a dire que la PCR n'est 
pas suffisamment specifique. Afin d'eviter tons problemes ulterieurs, la totalite de la 
PCR est deposee sur gel et la bande d'intenSt est extraite en utilisant le kit Qiaex H 
30 (Qiagen). 

1. 1 .62.- Transfert de la banque cosmidique sur membrane Hybond N 
Le stock glycerol de la banque cosmidique realisee dans & coli HB101 est 
utilise pour inoculer 2 mL de milieu LBT 15 . Apres 8 heures de croissanc^ Ia DO est 
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estimee; des dilutions en cascade sont r£alisees afin d'&aler environ 1000 clones par 
boite (144 cm 2 ). Apres 16 heures de croissance a 37°C, les bacteries sont transferees sur 
des membranes Hybond N (Amersham) et lystes en suivant les recommandations de 
Boehringer Mannheim (1995). L'ADN lib£r6 est fix6 a la membrane par exposition aux 
5 U.V. (120 mJ delivres en 45 sec - Stratalinker ; Stratagene). Les membranes sont 
d£barass£es des debris cellulaires en realisant le traitement a la proteinase K comme 
preconis6 par Boehringer Mannheim (1995). 

1. 1. 6.3- Prehybridation - hybridation - detection 
Les etapes de prehybridation et hybridation se font dans un sac dispose sur im 

1(> plateau a bascule, en utilisant la technique d'hybridation avec la sonde marquee h la 
digoxygenine (Boehringer Mannheim, 1995). La prehybridation (5x SSC; 0,5% SDS; 
0,1% N-laurylsarcosine; 1% agents bloquants (Boehringer Mannheim, ref: 1096 176); 
100 ng.mL" 1 sperme de saumon sonique et denature) est realisee pendant 4 heures k 
65°C. L'hybridation de la membrane est faite pendant la nuit a 68°C (milieu 

15 prehybridation frais contenant 20 ngonL" 1 de sonde marquee a la digoxygenine et 
denaturee pendant 5 min a 100°C). Le lendemain, Pexces de sonde et les hybridations 
aspecifiques sont eliminees par quatre lavages avec le tampon A (0,5x SSC ; 0,1% SDS, 
65°C). Les membranes sont alors equilibrees pendant 5 min a temperature ambiante 
dans le tampon B (acide malique 138 mM, NaCl 142 mM, ajuste a pH 7,5 avec des 

20 pastilles de soude, 03% tween 20). Puis elles sont satur^es par des agents bloquants 
(Boehringer Mannheim) durant 30 minutes avant d'etre hybrid6es avec Panticorps Anti- 
Digoxigenine couple a la phosphatase alcaline CAnti-Digoxigenine-AP, Fab fragments' ; 
Boehringer Mannheim) dilu6 au 1/10000 dans une solution fraiche d'agents bloquants. 
Apres 30 minutes, les membranes sont rinc6es deux fois 15 minutes dans du tampon B, 

25 puis 6quilibrees 5 minutes dans le tampon r6actionnel de la phosphatase alcaline (Tris 
0,1 M; NaCl 0,1 M; MgCl 2 0,05 M pH 9,5). Les membranes sont recouvertes avec 1 mL 
de CSPD pret a l'emploi puis incubees 15 min a 37°C. Cette etape a 37°C pennet une 
activation rapide de la phosphatase alcaline couptee a Panticorps. On r6v61e les 
membranes en exposant des Hyperfilm® ECL (Amersham) pendant 1 & 15 minutes. 

30 1.1.6.4- Analyse des cosmides positifs par Southern etPCR 

Les cosmides identifies lors de Fhybridation sur membrane sont confirmes par 
PCR et par la technique de Southern. Dans ce cas, TADN cosmidique, purifie par lyse 
alcaline (Maniatis et al 9 1982), est digerS par des enzymes de restriction puis s£par6 sur 
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gel d'agarose a O^/o.-Les gels sont transferes sur membrane Hybond IsT (Amersham) 
par la technique de Southern en 20x SSC (Ausubel et ah, 1995). Apres transfert, la 
membrane est rincee au 2x SSC, puis l'ADN est fixe a la membrane grlee aux U.V. 
(120 mJ delivres en 45 sec - Stratalinker ; Stratagene). La membrane est alors revelee 
5 en utilisant la technique de sonde fioide decrite precedemment 

1.1.7- Vecteurs declonage etbacteries botes 

Les sequences d'ADN amplifiers par PCR sont generalement donees dans le 
plasmide p-GEMT-easy (Promega) qui permet un criblage par le technique "bleu- 
blanc". Pour la surexpression, on utilise le plasmide pKK223-3 (Pharmacia) qui place le 
10 gene sous la dependance d'un promoteur tac. Les clonages sont generalement realises 
en utihsant R coli DH5a (New England Biolabs) ou E. coli XL1 Blue (Stratagene). 
Pour la surexpression on preferera E. co// BL21(DE3). ' 

1.1.8- Activite enzymatique de l'acetolactate synthase (ALS) 

L'activite ac6tolactate synthase (ALS) est mesuree en utilisant la methode 
15 colorimetrique deerite par Chang et Duggleby (1997). Les reactions sont conduites en 
microplaques avec un volume total de 250 uL. Pour chaque reaction, 25 uL d'enzyme 
sont incubees 30 min a 37°C dans 225 uL de milieu reactionnel constitue de KPi 50 
mM pH 7,0; pyruvate de sodium 50 mM ; TPP 1 mM ; MgCl 2 10 mM ; FAD 10 uM. La 
reaction est arretee par ajout de 25 uL d'H 2 S0 4 10 %. Les microplaques alors sont 
20 incubees a 60°C pendant 15 min. Puis on ajoute 250 uL de creatine 0,5 % et 250 uL 
d'a-naphtol a 5 % dans du NaOH 4M(la solution d'a-naphtol doit Stre preparee moins 
de 10 min avant usage). La microplaque est alors incubee 15 minutes a 60°C puis 15 
minutes a temperature ambiante. Une couleur rouge cerise apparait La lecture est 
realisee a 525 nm (e^ 22 700 M 1 cm*'). 
25 1.2- Resultats - Discussion 

L'HPP oxydase est la premiere activite enzymatique que nous souhaitons 
iniroduire dans la plante dans le cadre de la creation de la voie metabolique contournant 
PHPPD. Afin de pouvoir identifier le gene codant Pactivite HPP oxydase differentes 
approches furent developpees: (1) la mutagenese insertionnelle et done Identification 
30 du gene par la perte de Pactivite enzymatique, (2) la complementation fonctionnelle 
d'un microorganisme en irtilisant une banque genomique, (3) la purification de la 
proteine pour remonter a la sequence nucleique. C'est la troisidme voie qui a ete 
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L2.1- Purification de PHPPO 

1.2.1.1- Optimisation des conditions de culture 
Avant de commencer k purifier la proline, il est utile de determiner quels sont 
les conditions de culture qui permettent son expression dans la bacterie. Les resultats 
5 ^optimisation des conditions de culture montrent que Pactivite HPP oxydase n'est pas 
detectable lorsque la crpissance d' A globiformis est faite au depend d'une source de 
carbone telle que le succinate, le fumarate ou le glucose. Par contre l'activite HPP 
oxydase est d£tectee lorsqu' A. globiformis est cultive en utilisant T HPP, la tyrosine ou 
la phenylalanine comme seule source de carbone. Si Ton augmente la quantite d'extrait 

10 de levure (par exemple 200 mg.1/ 1 au lieu de 20 mg.1/ 1 ) on observe une diminution de 
Pactivite enzymatique produite. Sur la base de ces observations, le milieu M Ag est 
defini. Enfin, on observe qu'une culture a forte densite (en* debut de phase stationnaire ; 
DO^ - 1) presente une activite enzymatique HPP oxydase plus faible que dans le cas 
d'une culture en phase exponentielle de croissance (DO 600 ~ 0,4). 

15 1.2.1.2- Tests prelimiaaires 

Nous venons de definir le milieu optimal pour la production de FHPPO, nous 
allons maintenant rechercher les conditions qui n'alterent pas la stabilite de Pactivite 
HPP oxydase lors des processus de purification. Pour les chromatographies impliquant 
les resines echangeuses d'anions et les chromatographies en fonctioh du pH, il est 

20 important de connaitre la sensibilite de P enzyme au pH et aux sels. Nous observons que 
le pH optimum est eompris entre pH 7,0 et 7,8 ainsi que Pavait dej& demontre Blakley 
(1977). L'enzyme semble peu sensible aux s£ls (NaCl et KC1) puisqu'il faut des 
concentrations superieures k 750 mM pour observer une baisse de Pactivite 
enzymatique. Nous connaissons maintenant les conditions permettant une bonne 

25 expression de Pactivite enzymatique et nous avons determine la sensibilite de Pactivite 
HPP oxydase k des facteurs pouvant intervenir lors de la purification. La purification de 
PHPPO peut done commencer. 

1.2.2.3- Purification de 1'HPPO 
Pour purifier PHPPO, on applique le protocole decrit precedemment. L'activite 

30 enzymatique est eluee de la DEAE EMD 650S avec 150 a 200 mM de NaCl en solution 
dans un tampon phosphate 50 mM pH 7,4. Les fractions contenant Pactivite 
enzymatique sont rassemblees et conservees pendant la nuit k 4°G. En effet la 
congelation a cette etape entraine une perte d'activite. Les proteines sont ensuite 
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chargees sur une resine Source Q. L'activite enzymatique est alors eluee avec une 
concentration en NaCl comprises enue 150 et 200 mM en solution dans un tampon 
phosphate 50 mM pH 7,4. Les fractions contenant l'activite enzymatique sont 
rassemblees puis concentrees sur membrane UVDCON 10 kDa, et conservees a 4°C 
5 pendant la nuit Enfin l'HPPO est purifiee lors d'une troisieme etape en appliquant un 
gradient phosphate sur colonne d'hydroxyapatite. L'activite est eluee avec une 
concentration de phosphate voisine de 30 mM. Les fractions contenant l'activite 
enzymatique HPP oxydase, en sortie de colonne d'hydroxyapatite, sont alors analysees 
sur un gel SDS-PAGE a 8,5% colore au nitrate d'argent. Le gel presente revolution de 
10 deux bandes proteiques. Par comparison entre le profil d'activite enzymatique et le 
profil d'elution des proteines, nous considerons que l'HPPO correspond a la prot6ine de 
plus haut poids moleculaire (environ 60 kDa). Dans l'essai presente, la purification est 
initiee avec 1,5 g de proteines solubles extraites d'A. globiformis et nous avons recupere 
150 ng d'un melange de proteines (dont environ 70 ug d'HPPO). Le facteur de 
1 5 purification en terme d'activite specifique n'a pas ete determine. En effet, nous utilisons 
des conditions de reaction totale pour suivre l'elution de l'activite enzymatique. En 
outre, la problematique etait davantage 1 'identification de la proteine que la mise au 
point d'un protocole de purification. L'analyse HPLC, des reactions faites au sortir de 
chaque etape de purification, montre rapparition d'un produit qui presente le meme 
20 temps de retention que le standard 4-HPA (SIGMA). Quarante picomoles de la proteine 
HPPO (60 kDa) sont transferees sur une membrane PVDF et sont envoyees pour le 
sequencage en meme temps que 40 pmol de la proteine incluse dans le gel d'acrylamide. 
Les proteines transferees sur membranes servent a determiner la sequence N-terminale 
tandis que les proteines incluses dans le gel sont utilisees pour determiner la sequence 
25 de peptides internes. 

1.2.2.4- Resultats de sequencage de l'HPPO 
Peu de peptides internes sont obtenus en sortie d'HPLC apres digestion de 
l'HPPO par l'endoprotease Lys-C. Ce resultat suggere que la proteine contient peu de 
lysine , en effet l'endopeptidase Lys-C coupe apres les lysines. Si la lysine est peu 
30 fiequente, la digestion par l'endopeptidase K genere des fragments peptidiques longs qui 
restent adsorbes dans la colonne et ne peuvent pas etre elues, meme en utilisant des 
conditions tres hydrophobes. En se basant sur la forme des pics chromatographiques 
ainsi que sur la quantite apparente, on selectionne puis on sequence trois peptides. Leur 
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denomination est fonction de leur ordre de sortie de la colonne HPLC: ^peptide N°4, 
peptide N°6, peptide N°ll. Leur sequence est respectivement: (A) WWAEALK, 
AAAGRILRLL DDAAGANASK, XDNRFTAVDF XT (oil X est un acide amin6 non 
determine). Lat sequence des 30 premiers acides amines N-terminaux est obtenue avec 
5 : , un rendement initial de 40 %: TSLTVSGRVA QVLSSYVSD VFGVMGNGNV Y. L'acide 
amine (methionine ou valine) correspondent au codon initiation (ATG ou GTG) n'est 
pas retrouve. Le rendement initial obtenu (15 pmol equivalent BSA), compar6 avec 
ceM obtenu pour les peptides internes (30 a 35 pmol equivalent BSA), suggere qu'une 
partie des proteines etaient bloquees en N-terminal. La sequence N-terminale et les 
1ft sequences internes obtenues ne pr^sentent aucune homologie dans les bases de donn£es. 
En nous basant sur les sequences peptidiques obtenues, des oligonucleotides d6gen£res 
sont synth6tis6s afin d'identifier le gene HPPO par PCR. 

1.23- Validation des techniques PCR et identification d'ime partie du gene 

hppO 

15 1.2.3.1- Validation des techniques PCR 

La teneur en base guanine et cytosine (GC %) de la majorite des ADN 
genomiques des Arthrobacter sp. est comprise entre 59 et 66 %, cependant il est de 67 & 
69 % pour A. agilis (anciennement Micrococcus agilis) (Koch et aL 9 1995), de 70 % 
pour A. atrocyaneus (Jones et aL, 1991) et de 73 % pour un Arthrobacter sp. identifte 

20 dans les glaces arctiques (Junge et al. 9 1998). Ces fortes teneurs en guanine et cytosine 
peuvent rendre plus difficile la mise en oeuvre de la PCR. Pour cette raison que nous 
avons valide nos m6thodes PCR (ADN g&iomique, polymerases, . . .) en utilisant le gene 
codant la 'Manganese dependent Dioxygenase 9 (MndD) & Arthrobacter globiformis 
(Boldt et aL, 1995). Cette enzyme de la voie de degradation de THPP catalyse 

25 rouverture du cycle aromatique du 3,4-dihydroxyphenylacetate. Pour ramplification 
controle du gene MndD, nous avons teste des polymerases thermoresistantes de 
thermophilic aquaticus (Taq) commercialisees par diffgrents fournisseurs (Perkin 
Elmer, ATGC, Appligfene, Qiagen, Sigma). Dans tous les cas, ^amplification du g6ne 
MndD est obtenue. Cependant, dans des conditions equivalente, en utilisant les amorces 

30 deg6a6r£es codant les peptides de PHPPO, I'amplification du gdne hppO n'est pas 
obtenue m&ne en utilisant des additifs (DMSO, glycerol). 

1.2.3.2- Identification par PCR de la partie N-terminale du gene hppO 
Nous amplifions de maniere spdcifique une sequence d*ADN de 936 pb qui 
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pourrait correspondre a la partie N-terminale du gene hppO. L'amplification est obtenue 
en utilisant d'une part les amorces degen&ees Ox3: TTNGCNCCNG CNGCRTCRTC et 
OZ10N: GAYGTNTTYG GNGTNATGGG NAAYGG corresponds respectivement a une 
partie du peptide N°6 et a une partie de la sequence peptidique N-terrninale et d'autre 
part le kit 'Advantage GC Genomic PCR> (Clontech). Le kit de Clontech est concu pour 
realiser des PCR sur des genomes riches en bases GC. II contient un melange de 
polymerases thermoresistantes (dont la 73*) et un additif a base de betarne. La Tth est 
une polymerase thermoresistante purifiee a partir de Thermits thermophilus. La 
degenerescence de chaque amorce est de 1024; c'est a dire qu'urie amorce sur 1024 
presente la sequence nucleique exacte du gene recherche. La degenerescence provient 
du fait qu'un acide amine pent etre code par plusieurs codons, pour exemple, l'alanine 
est codee par quatre codons (GCA, GCC, GCG, CGT); Le code de degenerescence 
utilise pour les amorces est defini comme suit : N = A ou T ou G ou C ; R = A ou G ; Y 
= T ou C. Les temperatures theoriques d'hybridation sont respectivement de 55,4°C et 
1 5 57,6°C. Malgre une temperature d'hybridation de 60°C utilisee lors de la PCR, ramorce 
GX3 seule permet des amplifications non specifiques. Nous avons amplifie par PCR un 
fragment d'ADN de 936 pb de maniere specifique en utilisant deux amorces dggenerees. 
Nous devons nous assurer que cet ADN amplifie correspond bien au gene hppO 
recherche. 

20 L2.4- Caracteristique du fragment d'ADN de 936 pb 

Le fragment d'ADN de 936 pb, amplifiee par PCR, est purifie sur gel d'agarose. fi 
est alors clone dans pGEM-T easy, selon les instructions du foumisseur, puis sequence. 
Lorsque Ton traduit la sequence nucleique obtenue, on observe qu'elle code aux deux 
extremites pour la totalite du peptide N°6 et pour une bonne partie de la sequence N- 

25 tenninale. Nous sommes done sur d'avoir amplifie une partie du gene codant la proteine 
purifiee et microsequencee, 1'HPPO. La sequence nucleique contient 73% de bases 
guanine (G) et cytosine (C) on note en outre la possible formation de structures 
secondares dites «en epingles a cheveux" {stem-loop) dans les 250 premieres bases de 
TARN messager. Cette haute teneur en bases G et C ainsi que l'existence de ces 

30 structures secondaires peuvent expUquer en partie les difficultes rencontrees pour 
parvenir a ^amplification par PCR d'une partie de ce gene. La sequence nucleique de 
936 pb ainsi que la sequence protfique correspondante ne presentent pas d-homologies 
avec les sequences enregistrees dans les bases de donnees. Nous possedons inaintenant 
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une sequence de 93 6 pb, orientee de N-terminal vers le peptide interne N°6. La proteine 
faisant environ 60 kDa, nous recherchons un gene d'environ 1650 pb. II reste done a 
identifier environ 700 pb. Pour cela nous allons cribler la banque g&iomique d*A. 
globiformis r6alisee dans le cosmide pLAFR5 et amplifiee dans E. co/rHBlOl . 
5 L2.5- Criblage de la banque cosmidique & A* globiformis 

La banque genomique realisee est transferee sur membrane, puis criblee en 
utilisant, comme sonde, le fragment d'ADN de 936 pb marque k la digoxygenine. Le 
protocole standard est adapte pour un ADN "classique" (60% AT), tandis que le 
fragment de 936 pb presente une proportion estimee de 23% AT, Si nous gardons le 

10 meme rapport dUTP-Dig/dTTP que dans le cas d'un ADN classique nous obtenon^ une 
sonde faiblement marquee done une detection moins sensible. Nous avons done 
optimise la proportion dUTP-Dig/dTTP necessaire pout le marquage de la sonde 
(paragraphe IL7.1). Le criblage de la banque genomique a permis d' identifier quatre 
cosmides (CoslA, Cos2A, Cos4A, Cosl7Al) ayant des profils de restriction difiterents. 

1 5 En comparant les resultats d'hybridation de Southern obtentis k partir des cosmides avec 
ceux obtenus a partir de V ADN genomique & Artkrobacter globiformis, nous 
selectionnons le cosmide 2A. La figure N°14 illustre la demarche utilisfe en prenant 
pour exemple la digestion des cosmides par Fenzyme de restriction Not L Nous 
observons tout d'abord que le vecteur cosmidique pLAFRS, dig&re par Not I, n'hybride 

20 pas avec la sonde Z2-Dig. Par contre, nous observons que le cosmide 1 A presente une 
seule bande d'hybridation a 2,3 kb alors que les cosmides 2A, 4A et 17A pr&sentent 
deux bandes d'hybridation k 4,3 et 2,3 kb. Or la digestion du genome d % A globiformis 
par Not I produit deux bandes de 4,3 et 2,3 kb; de fait nous considerons que le cosmide 
1A ne contient pas toute Pinformation que nous recherchons. En nous basant sur 

25 d'autres restrictions et en utilisant une demarche 6quivalente nous elimindns les 
cosmides 4A et 17A. Le Cosmide 2A est alors sequence sur une distance d'environ 3 kb 
de part et d'autre du site Not I identifi6 au milieu de la sonde Z2-Dig. Les r6sultats 
d'hybridation de PADN genomique montrent en outre que le gene est present k une 
seule copie. Nous avons identifi6 le cosmide 2A que nous avons fait sequencer sur 6,2 

30 kb. Nous allons maintenant pouvoir analyser cette sequence d'ADN issue de genome 
d'Arthrobacter globiformis. 

L2.6- Analyse globale de 6,2 kb d'ADN genomique d*Arthrobacter 
globiformis. 
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En utffisanOeJogiciel Vector Nti, la position des genes potentiels est definie a 
partir de la sequence nucleique de 6255 pb obtenue en sequen^ant le cosmide 2A. Nous 
retrouvons la sequence de 936 pb, identified par PGR, comme faisant partie d'un gene 
potentiel. Ce gene potentiel correspond done vraisemblablement au gene hppO. Quatre 
aulres genes (A, B, C, D) sont potentieUement identifies (Figure 3) en effectuant une 
recherche par homologie en utitisant 1'algorithme BLASTX. Le gene A coderait un 
transporteur d'acide amines, le gene B coderait une bistidinol-phosphate 
aminotransferase cependant de precedents travaux montrent que cette enzyme possede 
Tactivite tyrosine aminotransferase chez la bacterie a Gram positif Bacillus subtilis 
(Nester & Montoya, 1976), le gene C coderait un regulateur de transcription, tandis que 
le gene D coderait un regulateur d'operon. 



L2.7- Analyse du gene hppO 

l5 1.2.7.1- Description g^nerale 

Sur la sequence obtenue de 6256 pb, le gene hppO (en vert) est delimite en 5' par le 
codon d'initiation ATG en position 3143 et en 3' par le codon stop TAG (en rouge) en 
position 4823. Le gene presente done une longueur reelle de 1680 pb. fi presente une 
forte teneur en bases G et C (71,4 % GC). La recherche d'homologies au niveau des 
20 sequences nucleiques (BLASTN), ne permet aucune identification. Afin de mieux 
caracteriser le gene, nous recherchohs les elements specifiques de la transcription et de 
la traduction. 

1.2.7.2- Elements caracterisant la transcription et la traduction du gene %?0 
Nous identifions les potentielles boites promotrices de la transcription (Figure 4). La 

25 boite «-10», dite «boite de Pribnow», est situee entre les positions 3082 a 3088 
(AAAAATA) et la boite « -35 » est situee en position 3055 a 3059 (TTGCA). Les 
boites ainsi d<Sfinies sont l^gerement diflerentes des sequences canoniques 
(respectivement TATAAT et TTGACA ; Singer & Berg, 1992). Cela pent refleter une 
interaction faible avec les fecteurs permettant la transcription constitutive ou bien la 

30 necessaire interaction avec des fecteurs de transcription differents. L'adenine en position 
3096 pourrait etre la base d'initiation de la transcription. Enfin nous identifions entre les 
positions 3068 a 3072 (TGTGA) une sequence correspondant au site d'attachement de 
la proteine CAP (catabolic gene activator protein). Le fait de retrouver ce site de 
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fixation de la proline CAP va dans Ie sens des r£sultats obtenus Iors de Poptimisation 
des conditions de culture. En conclusion la transcription du gene hppO est 
vraisemblablement sous le controle d'un promoteur faible, notamment rggute par le 
glucose. La sequence de Shine-Dalgarno (Singer & Berg, 1992) permet la fixation de la 
5 petite sous unit6 ribosomique. Elle est identifi^e (GACGAT; en position 3131 k 3136) 
12 bases en amont du codon d'initiation (ATG) de la traduction, par analogie avec la 
sequence consensus AGGA. On observe en outre que la partie 5' tenninale (environ 
250 bases) de TARN messager est capable de se structurer en epingle a cheveux (stem- 
loopy Or la structure secondaire de la region de TARNm qui avoisine 1* ATG initiateur 
10 influence T6tape d'initiation de la traduction. Ainsi r initiation est nulle ou peu efficace 
lorsque FATG initiateur ou la sequence Shine-Dalgarno sont impliques dans un 
appariement intramoleculaire. On peut done se poser la question d'un 6ventuel role 
r6gulateur de la traduction des structures en epingle a cheveux observees. 

15 1.2.7.3- Expression de FHPPO sous la dependance du promoteur tac 

La surexpression de PHPPO est intdressante pour definir les caracteristiques 
cinetiques, pour permettre la production d'anticorps, mais aussi en vu de 1' analyse 
stracturale. Le gene est clone dans un vecteur pKK223-3 en deux etapes. Le gene, 
amplify par PCR dans les conditions definies pour Tidentification du gene hppO et en 

20 utilisant les amorces HPP-N-sens (CATGACTTCA CTTACAGTGT CC) et HPP-C-term 
(CAAACTGAGT AGCAGCTCAG G), est c!on6 dans le vecteur pGEMT-easy. On 
selectionne le clone presentant le gene hppO en antisens du promoteur lac. On le dig£re 
alors par Eco RI. Ce faisant on recup&re le g&ne hppO que Ton insert dans le vecteur 
pKK223-3 dig6r<S par Eco RI. Le clone pKK3-2, pr&entant le gdne hppO sous le 

25 controle du promoteur tac 9 est retenu. Lorsque Ton induit l'expression du clone pKK3-2 
par 1'ajout d'IPTG, on peut d&ecter une activity HPP oxydase. Cependant la proteine 
surexprimee (57,4 kDa) n'est pas d^celable dans un extrait brut separ6 sur gel 
acrylamide denaturant II reste done a ameliorer le protocole de surexpression. Nous 
envisageons en outre de doner FHPPO en fusion avec une sequence Tag, (GST, poly- 

30 histidine, proteine A....) afin de faciliter la purification de la proline surexprimee. 
Nous venons definitivement de montrer que le g&ne identify codait une activity HPP 
oxydase. Cependant, en r£alisant des recherches d'homologie au niveau des sequences 
proteiques (BLASTX ou BLASTP), nous observons que la proline HPPO pr&ente 
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jusqu'a 25% d'identite ayec des acetolactate synthases (ALS) y des pyruvate oxydases 
(POX) et des pyruvate deshydrogenases (PDH). II est ainsi possible d'identifier des 
motife tres conserves tel ceux concernant la fixation du cofacteur TPP (Figure 5). En 
outre le profil d'hydrophobicite de FHPPO est tres proche de celui obtenu pour des ALS 
5 (non montre). Afin d'etre sur que le gene identifi6 code reellement FHPPO et non pas 
une ALS, une POX ou une PDH ayant une activite annexe de type HPP oxydase, nous 
decidons de tester l'HPPO pour une eventuelle activite annexe. 
L2.8-HPPOve«««sALS 

Les recherches d'homologies proteique montrent que FHPPO presente jusqu'a 
10 25% d'identit^ avec des ALS. Ce resultat, bien que surprenant au premier abord, 
presente une certaine logique. En effet ces deux enzymes utilisent le FAD et le TPP 
eomme cofacteurs reactionnels. Elles reaUsent toutes deux une decarboxylation. Par 
ailleurs, Fun des substrats de FALS est le pyruvate, or notre substxat un pyruvate p 
substitu6 : I'hydroxyphenylpyruvate. D est done possible que la structure du site actif 
15 soit voisine et que par consequence ces proteines partagent des activites en2ymatiques 
communes. Nous avons utilise la grande sous-unite recombinante et purifiee des ALS 
d'Arabidopsis thaliana (Chang & Duggleby, 1997) et de K coli (Hill & Duggleby, 
1998) pour servir de contrdle positif dans nos experiences realisees pour rechercher une 
activite ALS chez FHPPO. Les resultats obtenus montrent que l'HPPO ne presente pas 
20 d'activite ALS. Nous montrons aussi a cette occasion que les deux ALS testees n'ont 
pas d'activite HPP oxydase. Enfin nous observons que FHPPO n'est pas inhibe par 115 
ppm d'imazapyr (inhibiteur d'ALS, Cyanamid). Ces resultats montrent que bien qu'en 
depit de points communs (sequence proteique et hydrophobicite) les ALS et FHPPO 
sont des enzymes bien distinctes, n'ayant pas d'activites enzymatiques secondaires; 
25 Exemple 2 IDENTIFICATION DES GENES CODANT LA 4-HPA 1- 
HYDROXYLASE 

La 4-HPA 1 -hydroxylase (HP AH) convertit le 4-HPA en HGA par une reaction 
d'hydroxylation accompagnee par un deplacement de la chame acetyle. Son activite a 
ete caracterisee sur extraits bruts de Rhodococcus erythropolis Sl(Suemori et al. y 1995) 
30 ou sur extrait partiellement purifies de P. acidovorans (Hareland, 1975). Elle a 6t6 
purifiee par Suemori et at. (1996) cependant les sequences proteique et genetique ne 
sont pas publiees. Afin de pouvoir introduire cette activite enzymatique dans la plante, il 
est necessaire d'identifier le gene. 
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Differentes approches sont envisageables: (1) la complementation phenotypique 
et/ou fonctionnelle en utilisant une banque genomique, (2) la mutagenese insertionnelle 
et done ^identification du gene par la perte de l'activit6 enzymatique, (3) la purification 
de la prot6ine pour remonter a la sequence nucl&que. Nous avons choisi de d&velopper 
5 ces trois approches avec Pseudomonas acidovorans car il y a de nombreux outils de 
biologie moteculaire dont Fefficacite a ete d&nontree sur differentes especes et souches 
de Pseudomonas. A titre d'exemples nous pouvons citer le transposon mini-Tn5 (De 
Lorenzo et a/., 1990), les vecteurs large spectre d'hote tels pBBRlMCS (Kovach et ah, 
1994, 1995; D'Souza et al. 9 2000), les techniques de transfert par conjugaison. Le 
10 transposon mini-Tn5 peut etre utilise soit pour perturber un gene (de Lorenzo et aL 9 
1990 ; Fedi et aL> 1996 ; Campos-Garcia et aL 9 2000) soit pour introduire un gene dans 
le genome bacterien (Prieto et aL, 1999). Nous avons commence par Fapproche par la 
complementation ph6notypique car e'est ce qui paraissait le plus rapide et le plus 
simple. Cette approche a ete suivie par les deux autres simultanement Cependant, nous 
15 n'aborderons pas ici Fapproche par mutagenese insertioimelle, cette voie n'ayant pas et6 
exploitee par la suite. 
ELI- Materiels et Methodes 

EL1.1- Construction d'une banque genomique de P. acidovorans dans EL coli 
Pour construire la banque nous utilisons le cosmide pLAFR5 et PADN genomique 
20 de P. acidovorans. Nous utilisons la souche hote E. coli HB 101. 
EL1.2- Purification de la 4-HPA l-hydroxylase 
n. 1.2.1- Test d'aetivite spectrophotom^trique 
Dans la reaction catalysee par la 4-HPA 1 -hydroxylase, dScrite par Harelahd et 
ah (1975), il y a consommation d'oxygene mol6culaire et de NADH,H\ Nous avons 
25 choisi de mesurer l'activite enzymatique en suivant Toxydation du NADH,H*en NAD + . 
Le milieu r^actionnel comprend: NADHJHT 300 jxM; FAD 6,7 |iM; KPi 100 mM; DTT 
1 mM; 10 a 50 jig de prolines. La reaction est declenchee par 1'ajout du substrat: 4- 
HPA 1 mM. La reaction est suivie a 340 nm ou h 292 nm pendant 2 4 10 min. En effet, 
la consommation du NADHJT se traduit par une diminution de Tabsorbance h 340 nm 
30 tandis que la production d'homogentisate se traduit par une augmentation de 
Tabsorbance a 292 nm. Le test spectrophotometrique est trds rapide, il est utilise en 
routine pour suivre Mution des proteines lors des etapes de purification. 
n.1.2.1- Test d*activit6 HPLC 
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L'analyse destructions enzymatiques par HPLC permet de confirmer la 
production d'HGA (temps de retention, spectre UV). Le test enzymatiqiie est realist 
dans les memes conditions que ci-dessus. Cependant la reaction est arrefee par ajout 
d-un tiers de volume d'acide percMorique 20%. Les reactions sont alors analysees par 
5 HPLC en elution isocratique avec 90% de phase A et 10 % de phase B ou 92% de phase 
A et 8% de phase B. La phase A est de l'eau rnffli Q contenant 0,1% d'acide 
trffiuoroacetique (TFA) et la phase B correspond a de l'acetonitrile. Dans r&ution en 
isocratique 90% - 10%, l'HGA est Slue en 1,2 min alors qu'en systeme isocratique 92% 
- 8% il est elue en 1,4 min. L'&ution est enregistree generalement a 230 nin. Van den 

10 Tweel et ah (1986) ont utilise le 2^'-bipyridyl (inhibiteur de proline a fer non 
hemique) pour inhiber ITiomogentisate dioxygenase et ainsi permettre l'accumulation de 
l'HGA. Pour cette raison, nous ajoutons dans certains milieu reactionnel 2 mM de 2^- 
bipyridyl. Dans ces conditions chromatographiques, il est possible d'identifier le 4-HPA 
et l'HGA. La chame HPLC est constitute d'une HPLC Alhance 2690 (Waters) et d'un 

15 dttecteur a barette diode 996(Waters) . 

H. 1 .2.3- Purification de la proteine HPAH 
Pseudomonas acidovorans est cultive 48 heures sur milieu M63 contenant du 4- 
HPA comme seule source de carbone, a 29°C, 220 rpm. Les bacteries sont centrifugees 

20 a 3 000 gpendant 15 min a 6°C (Beckmann J2/21 Mm cenlrifuge). Le culot bacterien 
est repris dans le tampon de sonication (KPi 0,1 M pH 7A MgS0 4 ImM; DTT ImM; 
benzamidine hydrochloride 1 mM; acide caproTque 5 mM). La benzantidine 
hydrochloride et 1' acide caproique sont des inhibiteurs de proteases. La sonication est 
reaUsee pendant 9 minutes en sonieant toutes les quarante secondes pendant vingt 

25 secondes a la puissance 5 (Vibra Cell, Sonic Materials INC., Connecticut, USA). Durant 
la sonication, 1'echantUlon est maintenu a la temperature de la glace fondante. L'extrait 
soniqut est centrifuge a 15 000 g pendant 15 min a 4°C. Le sumageant recupere est 
precipite avec 1 % de sulfate de streptomycine. Le precipite est elimine par 
centrifugation a 15 000 g pendant 15 min a 4°C. Le sumageant est dessale sur colonne 
30 PD10 (Pharmacia) puis charge sur colonne DEAE/EMD 650 S equitibree en tampon A 
(KPi 20 mM pH 7,2, glycerol 10 %, MgSO, 1 mM, DTT I mM). L'aution se fait en 
utilisant un tampon B (tampon A; KC1 1 M; 100 uM FAD). L'activite 4-HPA 1- 
hydroxylase est eluee pour une concentration en KC1 voisine de 150 mM, Les fractions 
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actives, concentrees sxir membrane UVIKON 10 kDa puis dessal^es sur colonne PD10, 
sont alors deposees sur une colonne d'affinitS Red (Red 120 Agarose type 3000 CL, 
SIGMA Ref R-0503) equilibr6e en tampon A (ci dessus). L'&ution est r&disee en deux 
6tapes. La premiere est un lavage de la colonne Red en utilisant le tampon A enrichi 
5 avec du FAD 50 jiM final. La deuxidme pennet I'&ution de la prot≠ pour cela le 
tampon A est enrichi en FAD (3 wM) et en NADHH* (10 mM). Les fractions, 
contenant la proteine d'interSt, sont rassembl£es, concentres et congelees a -80°C. 

11.13- Microsequen^age proteique de Pextremite N-terminale et de peptides 

internes 

10 Le meme protocole que celui decrit dans le cas de PHPP oxydase a 6t6 utilise pour 

r£aliser le s6quen9age de la proteine purifiee. Cependant, pour produire les peptides 
internes, la proteine a 6t6 digeree a la trypsine au lieu de Fendopeptidase Lys-C. La 
trypsine coupe apres les arginines et les lysines. La digestion par la trypsine conduit 
g^neralement a Fobtention de fragments plus petits que ceux obtenus lors d'une 

15 digestion par Fendopeptidase Lys-C. Afin de pouvoir sequencer avec precision les 
peptides recuperes, il est parfois necessaire de repurifier par HPLC les peptides 
recuperes. 

II.1.4- Identification d'une partie du gene codant 1'HPAH par PCR 
degen&ree 

20 Pour la synthese des amorces degenerees on utilise le code de degen6rescence 

presente en page 43. La PCR est realisee dans un volume final de 50 |j,L, dans des tubes 
de 200 jiL. La solution r£actionnelle contient le tampon Perkin Elmer, 250 pM dNTP, 
50 ng d'ADN genomique de P. acidovorans, 2 unites enzymatiques d'AmpliTaq (Perkin 
Elmer). La reaction est realisee en utilisant un thennocycleur "Hybaid Touchdown": 3 

25 min a 94°C, puis quarante cinq cycles : 30 sec a 94°C, 1 min a 50°C, 1 min 30 sec a 
72°C, suivi d'une elongation finale de 5 min k 72°C avant de revenir a 4°C. La PCR est 
evaluee aprds depot de 10 nL sur gel 1% agarose. Dans ces conditions une bande de 
536 pb est identifiee. 

n.1.5- Criblage de la banque cosmidique de P. acidovorans 

30 Etalement de la banque cosmidique sur milieu LBT 15 et croissance pendant 1 6 hOO 

a 37°C. Les boites sont alors transferees h 4°C. Au bout d'une heure, les colonies sont 
transferees sur membranes Hybond N (Amersham) selon la methode de Grunstein & 
Hogness (1975). Les membranes sont hybridees en utilisant le fragment PGR de 536 pb 
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preoMemment identified purified La detection est iealisee en La sonde est marquee 
en utilisant le kit « DNA Ready to Go » (Pharmacia). La pre-hybridation, l'hybridation 
et les lavages sont realises en ampoules. Les membranes sont pre-hydridees dans une 
sohmon compose de SSC 5x, Denhardt 6%, SDS 0,5% pendant 4 heures a 68°C. 
5 L'hybridation est realisee pendant 16 heures k 68°e. Les lavages sont effectues a 65°C 
en SSC 2x, SDS 0,1%. Les membranes sont revelees en exposant des films Kodak ou 
Amersham. 

II.L6- Milieux de croissance de P. putida 

Pseudomonas putida est cultive sur milieu riche de Luria-Bertani (LB) ou 2 YT 
10 contenant 100 pgjnL r de rifampicine. En fonction des besoins d'autres-antibiotiques 
sont ajoutes (exemple : tetracycline a 1 5 ag-mL 1 ). Le milieu minimum M63 contenant 
1,5 g.L ' de 4-HPA comme seule source de carbone- est utilise pour tester la 
complementation fonctionnelle. Dans ce cas les antibiotiques sont omis. Toutes les 
cultures sont realisees a 29°C. 
15 II.1.7- Transformation de P.putida par electroporation 

1 litre de milieu LB Rifampicine (100 pg-mL 1 ) est inocute avec une culture de 
P. putida mise en croissance a 29°C pendant environ 16 heures en agitation a 180 rpm. 
Lorsque la DO^ est voisine de 1,2, les cellules sont collectees par centrifugation 
pendant 15 min a 3 000 g, 4°C. Le milieu de culture est elimine et les cellules sont 
20 reprises avec 400 mL de glycerol 10% a 4°C. Les cellules sont centrifugees une 
nouvelle fois a 3000 g, 20 min, 4°G Deux nouvelles Stapes de lavage sont effectuees 
avec respectivement 200 puis 100 mL de glycerol 10%, 4°C. Enfin, les bacteries sont 
reprises par 3 a 10 mL de glycerol 10% puis leparties en ahquotes de 100 uL 
immediatement congelees dans l'azote liquide. Les bacteries ainsi preparees se 
25 conserventau moins six mois a - 80°C. Lors de la preparation, on observe une perte de 
bacteries due a la lyse. L'ADN cosmidique (Tet*) est mtroduitpar electroporation dans 
les P. putida (Rif*). L'electroporation (Bio-Rad Gene Pulser™) de 80 ng d'ADN 
cosmidique dans 100 uL P. putida electrocompetentes se fait en cuvette 
dVSectroporation de 2 mm sous une tension de 0,9 volt avec une resistance de 
30 l'electroporateur de 200 £1 Dans ces conditions, la constants de temps x Dest d'environ 
4,5 msec. Apres le choc electrique, les cellules sont reprises avec 900 uL de LB et mise 
en culture pendant lh30 a 29°C, 180 rpm. Les P. putida transformees sont selectionnees 
sur milieu g61ose LB Rif 100 Tet". 
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EL1.8- Modification du vecteur large spectre d'hote pBBRlMCS~Gm R 

Nous avons utilise les vecteurs k large spectre d'hdte a Gram n£gatif de la serie 
des pBBRlMCS (Kovach et a/., 1994, 1995). Ces plasmides, qui possedent une origine 
de replication de Bordetella bronchiseptica, se r6pliquent a environ 20-30 copies par 
5 cellule chez R coli. lis contiennent deux sites Not L Afin de faciliter les clonages 
ulterieurs on supprime le site Not I present hors du multi-site de clonage (MCS) sur le 
plasmide pBBRl MCS-Gm R . Pour cela, le plasmide est coup6 par Sfi I (50°C) puis traite 
a la T4 DNA polymerase afin d'obtenir des bouts francs. Le plasmide est religue sur lui 
meme (T4 DNA Ligase - New England Biolabs). Apres ligation (16 heures, 16°C), une 
10 digestion par Sfi I est r£alis£e afin d'eliminer les £ventuels plasmides " sauvages puis 
on Slectropore E. coli DH5a. L'ADN plasmidique est isol6 des clones selectionnes sur 
milieu LB Gm 20 . Les ADN plasmidiques sont caracteris& par deux digestions: Not I et 
Not VBgl II. Un clone est retenu: pBBRlMCS-Gm-Not-U. 

11.1.9- Sous-clonage du Ccos8 dans pBBRlMCS-Gm-U 
15 Le cosmide Ccos8 est restreint par Not I puis depose stir gel agarose. Apres 

migration, 6 bandes d'ADN sont visualisees : 1 ,7 - 3- 4- 5- 8- 10 kbp. Les bandes 
sont purifiees par Quiaex II. Par ailleurs, pBBRlMCS-Gm-Not-U est restreint par Not I, 
dSphosphoryle en utilisant la phosphatase alcaline de crevette (S.A.P.; shrimp alkaline 
phosphatase). Les differentes bandes sont alors lides (T4 DNA ligase, 16 heures, 16°C) 
20 dans le vecteur en utilisant des rapports " insert/vecteur " variables. Les produits de 
ligation sont transform^ dans E. coli DH5a. 

IL1.10- Conjugaison tri-parentale entre K coli et P. put id a 

Afin de transferer les differents sous-clones de Ccos8 (Gm R ) de E. coli DH5a vers 
P. putida (Rif*), on opere par conjugaison tri-parentale sur filtre en utilisant le protocole 
25 decrit par De Lorenzo et ah (1990). Les bacteries r<Scup&6es sont Statees sur LB 
Rif°°Gm 20 et sur M63 ayant le 4-HPA comme seule source de carbone. 

n.1.11- Elimination du plasmide pSkbC 

Pour eliminer rapidement le plasmide p5kbC de P. putida y nous utilisons la 
strategic des origines de replication incompatibles et nous for9ons la perte du p5kbC a 
30 Taide d'antibiotiques. On transforme P. putida (Rif* 00 ) complements par le plamide 
p5kbC (Gm R ) avec pBBRlMCS Kn R . Les clones obtenus (Rif 100 Gm R Kn R ) sont verifies 
pour leur activity de complementation. Les clones sont alors cultives sur deux milieux : 
LB Rif 00 Kn ,5 ° Gm 20 et LB Rif 00 Kn 150 . Ce faisant nous maintenons la pression de 
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Election pour p5Jd>C et pBBRlMCS Kn R ou bien seulement pour pBBRlMCS Kn R . 
Les croissances sent realisees a 29°C. Le repiquage est realise tous les trois jours. Au 
huitieme repiquage, les colonies sont repiquees sur 4 milieux difFererits (M63, M63 + 4- 
HPA, LB Rif 00 Kn 1S0 Gm* et LB Rif 100 Kn 150 ) quelle que soit la boite d'origine. L'etat 
de croissance est alors releve au bout de 2 et 7 jours. 

n.1.12- Identification des proteines participant a I'activite enzymatique. 
11.1.12.1- Preparation d'extraits bruts de P.putida 
Deux clones P. putida sont cultives sur LB Gm 20 pendant 24 heures. Le premier 
comporte le plasmide pBBRlMCS-Gm-Not-U tandis que le second contient le plasmide 
de complementation p5kbC. Apres sonication dans un tampon (KPi O.i M; MgS04 
ImM; DTT ImM; benzamidine hydrochloride 1 mM; acide caproTque 5 mM), puis 
centrifogation a 20 000 g pendant 10 min a 4°C, le sumageant est teste pour son activite 
4-HPA 1-hydroxylase en utflisant les deux methodes de mesure de I'activite 
enzymatique. Les extraits bruts sont, en outre, analyses par SDS-PAGE a 10%, 
II. 1 . 1 2.2- Transfert sur membrane, Sequengage N-terminal 
Le sequencage est realise comme en exemple I. 

B.l. 12.3- Gel Filtration S75 
L'eluat (5 mL) est concentree d'un facteur 10 en utilisant un Macrosep™ 10 K 
(Pall Filtron) pendant deux heures a 4°C. Les 500 uL concentres sont injectes sur une 
eolonne de gel filtration Superdex™ 75 prep grade (HiLoad 16/60, Pharmacia) 
prealablement dquiKbree avec 700 mL de tampon (KPi 0,02 M pH 7,2; glycerol 10% ; 
MgS0 4 1 mM ; DTT 1 mM ; 4°C) a un debit de 0,7 mLamn\ La chromatographie est 
realisee a 4°C avec un debit de 1 mL.^ 1 . Les fractions sont collected toutes les 
minutes et conservees a 4°C. 

25 n.1.12.4- Construction de pBBRlMCS FT12A1 

Pour construire le plasmide pBBRlMCS FT12A1 on utilise une strategic de 
clonage en deux etapes. Le plasmide P 5kbC est digere par Nsi I et Not I. L'insert 
obtenu, codant les genes 1, hpaft et 3, est alors clone dans pBBRlMCS-Gm-Not-U 
digere Pst I et Not I. Le clone resultant, denornme pBBRlMCS FT12, est restreint par 
Hindm etAsc I, puis rendu bout-francs et enfin religue. Ce faisant, les genes 1 et 3 sont 
detruhs et le gene hpaH se trouve sous la dependance du promoteur lac du vecteur 
originel. Nous obtenons ainsi le plasmide pBBRlMCS FT12A1 (Figure 6). 
n.l. 12.5- Construction de pLllac2 
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Le laboratqjr^ possSde un plasmide denomm6 "Clone L" Cette construction 
correspond au clonage du promoteur et du gdne de THPPD de P. fluorescein dans le 
vecteur pBBRlMCS-Kn* Le promoteur du gSne HPPD est fonctionnel chez P. putida 
et chez E. colt Le plasmide "Clone L" est dig6re par Bam HI et Hin dm ce qui permet 
5 de recup6rer Finsert contenant le promoteur et le gdne HPPD de P. fluorescein. Cet 
insert est alors ligue dans le vecteur pBBRlMCS-Gm R digere par Bam HI et Hin din. 
Le clone resultant est denomme pBBRG-L-HPPD. Le plasmide obtenu, digere par Nco I 
pour eliminer le gene codant FHPPD, est ligu£ avec le gene hpaC amplifie par PCR et 
diger£ par Afl HI. La construction obtenue est appelee pBBRG-L-ORFL Pour 

10 ramplification du gene hpaC par PCR, on utilise des amorces qui permettent 
d'introduire un site Afl III en debut et en fin de gene (le site Afl in est compatible avec 
le site Not I). Les amorces utilisees sont : en 5* du gene: GCAGGATGCA 
CATGTCCACC AAGAC et en 3' du gene : CGGACGCCGA CATGTATCAG CCTTC. La 
PCR est realisee en utilisant 1 unite de KlenTaq polymerase (Sigma), 250 ^iM de dNTP, 

15 200 nM de chaque amorce et 50 ng du plasmide p5kbC. Le programme de PCR est 
defini comme suit sur Perkin Elmer 9600 : 3 min a 95°C ; puis 20 cycles : 94°C pendant 
1 min, 60°C pendant 30 sec, 68°C pendant 3 min ; enfin une derniere etape de 10 min a 
68°C est realisee. Le plasmide pBBRlMCS FT12A1 precedemment obtenu est restreint 
par Ssp I et Not I. Le site Not I est rendu franc par traitement avec la Pfu. Le fragment 

20 recup6re (2468 pb), contenant le gene hpaH sous la dependance du promoteur lac, est 
ligue dans pBBRG-L-ORF 1 digere par Ssp I. Le clone presentant les gfcnes hpaC et 
hpaH en antisens est retenu, il est nomme pLllac2. Tons ces clonages sont realisee dans 
KcoliDUSa. 
IL2- Resultats 

25 Diff&entes approches sont envisageables pour identifier le g£ne codant Factivit£ 

4-HPA 1 -hydroxylase de P. acidovorans. Nous d6cidons dans im premier temps 
d'utiliser une approche par coloration phenotypique. Cette approche parait simple et 
rapide. En effet, nous poss&ions au laboratoire un outil de criblage phenotypique pour 
detecter la production d'HGA. Or Fenzyme que nous recherchons convertit le 4-HPA en 

30 HGA. 

IL2.1- Approche par coloration phenotypique 

Nous avons observe au laboratoire qvfE. coli K12 ne peut pas croitre en utilisant 
la tyrosine ou le 4-HPA comme seule source de carbone. Nous savons d'autre part qu'£ 
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coli K12 possedel'aeuvite tyrosine aminotransferase qui permet la syhthese de tyrosine 
a partir d'HPP. Cette activite enzymatique est reversible, la cellule peut done produire 
de l'HPP a partir de la tyrosine. Si le milieu riche de culture est enrichi en tyrosme (1 
g.L ), la tyrosine est imporuS dans les bacteries qui l'accumulent puis la transfonne en 
5 HPP, selon la constante d'equilibre de la reaction de conversion entre HPP et tyrosine. 
Au laboratoire, nous avons deja observ6 que si nous introduisons l'HPPD de P. 
fluorescent dans K coli K12 alors l'HPP produit lors de la desamination de la tyrosine, 
est transfonne en homogentisate (HGA). La reaction catalysee par l'HPPD etant 
irreversible, l'HGA s'accumule dans la cellule ou il s'oxyde puis polymerise 
10 spontanement pour former un pigment ochronotique presentant une coloration brune. 
Nous avons done la un moyen de detecter la production d'HGA La 4-HPA 1- 
hydroxylase recherchee convertit le 4-HPA en HGA. On etale done les R coli HB101 
contenant la banque genomique de Pseudomonas acidovorans sur milieu gelos6 2YT 
enrichi en 4-HPA. Apres deux jours, deux colonies brunissent : elles produisent done de 
15 rhomogentisate. Cependant, les activites en2ymatiques realisees sur les extraits bruts de 
ces deux clones revelent une activite enzymatique de type HPPD alors que l'activite 4- 
HPA1 -hydroxylase recherchee est discrete, voire inexistante. A priori cette approche a 
permis de selectionner les clones dont le cosmide contient le gene codant une HPPD de 
P. acidovorans et non pas la 4-HPA 1 -hydroxylase. Lors de l'etude preliminaire in vitro 
20 sur les extraits bruts de P. acidovorans, l'activite HPPD n'a pas &e identifiee. On peut 
supposer que l'activite HPPD de P. acidovorans s'exprhnerait lorsque la bacterie est 
cultivee sur milieu riche tandis que Pactivite' 4-HPA 1 -hydroxylase s'exprhnerait 
lorsque le 4-HPA est la seule source de carbone. Cette approche ne permettant pas 
Tidentification de la 4-HPA 1 -hydroxylase nous decidons de purifier renzyme. Une fois 
25 la proteine identifiee, il sera possible de remonter au gene correspondant. 
Purification de la 4-HPA l-hydroxylase 
Pour suivre la purification de la proteine, nous utifisons le dosage de son activite 
NADHH* oxydase dependante du 4-HPA. Nous purifions ainsi la proteine a quasi 
homogeneity en appliquant le protocole de purification decrit precedemment Le facteur 
30 d'enrichissement de l'activite specifique NADH,fT oxydase est g6neralement compris 
entre 50 et 100 selon les preparations. Sur SDS-PAGE, la proteine presenfe un poids 
moleculaire apparent de 60 kDa. En fait, nous observons que l'activite NADHJT 
oxydase et la production dUGA sont bien visibles en sortie de DEAE/EMD 650S. Par 
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centre en sortie de^colonne d'afiBnit6, la production d'HGA est tr&s difficilement 
decelable; Tactivit6 NADHJH* oxydase reste cependant d£pendante de I'ajout du 4-HPA 
dans le milieu rSactionnel. Si nous partons de I'hypoth&se que Tenzyme est 
monom&ique, la perte de Tactivit^ catalytique permettant la production dUGA peut 
5 s'expliquer en supposant qu'une partie de la proteine a 6t6 endommagee (ex : perte d'uri 
cofacteur fortement lors de son passage sur la colonne Red. Le site catalysant 
Toxydation du NADH,H* ne serait pas touche. On peut aussi supposer que Tenzyme 
recherch£e est un heterodimdre. La perte de Factivit6 catalytique s'expliquerait alors par 
la perte du monomere responsable de la production d*HGA. Dans la literature de 

10 nombreuses monooxygenases heterodimeriques k flavine ont ete identifiees, ayant 
toutes un substrat aromatique, dans des especes bacteriennes variees (Adachi et aL 9 
1964; Arunachalam et ah, 1992, 1994; Prieto et aL y 1993; Prieto & Garcia, 1994; 
Arunachalam & Massey, 1994; Takizawa et aL, 1995; Xun, 1996 ; Xun & Sandvik, 
2000). Cependant, il existe deux hypotheses pour expliquer le fonctionnement de ces 

15 enzymes heterodimeriques: 

(1) Arunachalam et aL (1992, 1994) proposent que la 4-hydroxyph6nylacetate 3- 
hydroxylase de P. putida soit constitute tfune flavoproteine bomodimerique de 65 kDa 
ainsi que d'une proline de couplage de 38,5 kDa. La flavoproteine seule est capable 
d'oxyder le NADHJKT independamment de la presence de 4-HPA. Cette oxydation du 

20 NADH,H* permet de renouveler le "pool" de NAD + , mais produit de l r H 2 0 2 dans des 
proportions stoechiom&riques. Si la proteine de couplage est ajoutee, le complexe 
proteique devient capable dliydroxyler le 4-HPA en acide 3,4-dihydroxyph6nylac6tique. 
Ainsi, Toxydation du NADHJH* n'est pas gaspillte et permet la synthese dW 
metabolite. La proline de couplage seule n'a pas d' activity enzymatique. 

25 (2) Prieto et at. (1993, 1994) et Xun & Sandvik (2000) suggSrent que la 4-HPA 3- 
hydroxylase de E. coli W (ATCC 11105) soit consid6ree comme un nouveau membre 
des monooxygenases a flavine a deux composantes mobiles (TC-FDM). Les deux 
composantes seraient d'une part la 4-hydroxyph6nylac£tate 3-hydroxylase, une enzyme 
monom&ique de 59 kDa cod6e par le gfene HpdB 9 et d' autre part une flavinerNADH 

30 oxydoreductase monomerique de 19 kDa, cod£e par le gene HpaC. Dans ce cas, le FAD 
est r6duit au depend du NADHJT par la flavinerNADH oxydoreductase. Le FADH 2 
est alors utilise par F oxygenase pour permettre 1' oxydation du substrat en utilisant 
1'oxygene moteculaire. 
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L'enzyme que nous avons purifiee oxyde fortement le NADHJT mais produit tres 
peu d'homogentisate. En outre l'oxydation du NADHJT est dependante de l'ajout de 4- 
HPA. Ceci suggere que nous possedons une enzyme du type de celle decrite par Prieto 
et ed. Nous considerons done que l'enzyme purifiee est la 4-HPA 1 -hydroxylase 
5 (HPAH) recherchee. II est possible, que par la suite, il soit necessaire d'identifier une 
proteine de couplage pour optimiser 1'activite enzymatique. L'approche biochimique 
peut done se poursuiyre avec la proteine purifiee. 

H.23- Obtention des peptides internes et de la sequence N-terminale. 
La proteine purifiee est envoyee a l'Institut Pasteur pour 6tre micro-sequencee. 
10 G'est ainsi que l'on obtient la sequence N-tennhiale SHPAISLQAL RGSGADXQSI 
HIPYER et six peptides internes nonunes respectivement peptides N p 11C, 12D, 20A, 
22B, 23, 24 en fonction de leur ordre de sortie' de colonne: ATDFITPK, 
LGVGQPMVDK , WFAGDSAHG VSPFX, VTALEPQAEG AL, IDFQLGWDAD 
PEEEK, LSVPATLHGS ALNTPDTDTF. Sur la sequence N-terminale, on ne retrouve 
15 pas l'acide amine (methionine ou valine) correspondant normalement au codon 
d'initiation du gene (ATG ou GTG). Les analyses d'homologies dans les bases 
proteiquesen umisantralgorithme BLASTP ne permettent pas d'identifier de proteines 
homologues. Sur la base des sequences proteiques obtenues, nous faisons synthetiser les 
oligonucleotides degeneres correspondants. Ceux-ci sont utihses dans des reactions de 
20 PCR afin d'identifier une partie du gene codant la proteine HPAH purifiee et 
partiellement sequencee. 

II.2.4- Obtention du fragment PCR 

L'amplification par PCR d'une portion (536 pb) du gene codant la 4-HPA 1- 
hydroxylase est obtenue en utilisant les amorces degenerees Hy4R: TCYTCNGGRT 
CNGCRTCCGA et Hy5F: GGNGTNGGNC ARCCNATGGT qui cedent respectivement les 
peptides 23 et 12D. Ces amorces ont une temperature d'hybridation de 55,4°C et 
presentent une degenerescence de 128 et 512 respectivement La sequence amplified est 
clonee dans le vecteur pGEMT-easy puis eUe est sequencee. L'analyse de la sequence 
obtenue permet de retrouver, outre les sequences codant les peptides Hy4R et Hy5F, la 
sequence nucleique codant le peptide interne 22B. Ce dernier element permet de 
confirmer que nous avons bien amplifie une partie du gene codant la proteine HPAH 
purifiee. A ce stade, les recherches d'homologies dans les bases proteiques, en utilisant 
l'algorithme BLASTX, font ressortir quelques faibles homologies ^vec des 
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hydroxylases, des.oxydases et des monoqxyg6nases. En utilisant la sequence de 536 pb 
- amplifiee par PGR, nous allons pouvoir cribler une banque cosmidique de P. 
acidovorans afin de reehercher le cosmide contenant le gdne complet 
EL2.5- Criblage de la banque cosmidique de P. acidovorans 
5 Le criblage de la banque cosmidique, en utilisant comme sonde la sequence 

obtenue ci-dessus, a permis d'identifier 4 groupes de cosmides consid6res comme 
dififerents sur la base de leurs profils de restriction et d'hybridation apres transfert par la 
technique de Southern. Les cosmides N° 1, 2 9 6 forment le premier groupe, ies cosmides 
N° 3, 7, 9 forment le second tandis que les cosmides N°5 et 8 forment le troisi&ne • Le 
10 dernier groupe est represent^ par le cosmide N°4. Les resultats d'hydridation sugg&rent 
en outre que le gene hpaH recherch6 est present en un seul exemplaire dans le g6nome 
de Pseudomonas acidovorans. Nous avons identify des cosmides comportant au moins 
une partie du gene codant la proteine HPAH purifi6e. Entre temps, nous avons observe 
que P. putida etait incapable de croitre sur 4-HPA mais pouvait croitre en utilisant 
15 l'HGA comme seule source de carbone. Nous possedons done la un excellent crible 
pour la complementation fonctionnelle ; nous pourrons ainsi definir lequel de ces 
cosmides comporte le gene fonctionnel codant FactivitS 4-HPA 1 -hydroxylase. 
IL2.6- Complementation fonctionnelle avec les cosmides 

Les neuf cosmides precedemment identifies sont introduits dans P. putida par 
20 electroporation. Les clones obtenus sont alors repiqu6s sur milieu M63 contenant du 4- 
HPA comme seule source de carbone* Au bout de 7-8 jours seules les bacteries 
possedant le cosmide N°8 ont reussi a croitre. C f est a dire que seul le cosmide N°8 
contient toute rinformation exprimable permettant la conversion du 4-HPA en HGA 
utilisable par P. putida. Le cosmide est alors denomme Ccos8. La transformation avec 
25 Tensemble des cosmides est r6p6t£e. C'est toujours le cosmide 8 qui permet la 
complementation apres un certain d61ai (6-10 jours). Afin de pouvoir avancer dans notre 
apprpche de determination du fragment d'ADN minimum exprimant Tactivite 4-HPA 1- 
hydroxylase, il nous faut sous-cloner le Ccos8. La selection du sous-clone int<§ressant se 
fera en utilisant le crible de la complementation fonctionnelle. 
30 n.2.7r Sous clonage par complementation fonctionnelle 

La digestion par Not I du cosmide permet d'obtenir 6 fragments d'ADN de taille 
comprise entre 1,7 et 10 kb. Ces fragments sont clones dans pBBRlMCS-Gm-Not-U. 
Cinq sous-clones de Ccos8 sont obtenus. L'analyse par restriction montre que les 
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fragments de 4 et A&Asb ne sont pas sous clones. En revanche, nous observons que la 
bande de 5 kb observee initialement etait en fait une bande double de 5,1 et 5,2 kb: Ces 
clones sont passes, par conjugaison tri-parentale, de R coll a P. putida. Au bout de 5 
jours, seul P. putida contenant le sous-clone correspondent a la bande de 5,2 kb du 
5 cosmide Geos8 a pousse sur M63 contenant le 4-HPA comme seule source de carbone. 
Nous venons done d'identifier le fragment minimal comportant 1'activite 4-HPA 1- 
hydroxylase. Les clones correspondents a la bande de 5,2 kb sont nommes 5kbC. Pour 
confirmer le resultat de la complementation fonctionnelle, nous provoquons 
1'elimination du plasmide P 5kbC en utilisant la strategic des origines de replication 

10 incompatible* et en forcant 1' elimination du plasmide P 5kbC par la pression de selection 
des antibiotiques utilises. Nous observons que P. putida perd la capacite a croitre sur 4- 
HPA comme seule source de carbone lorsqu'il a perdu le plasmide P 5kbC. Nous en 
concluons que 1'activite enzymatique 4-HPA 1-hydroxylase est bien portee par le 
plasmide P 5kbC. Nous pouvons done faire sequencer l'insert de 5^ kb, ce qui devrait 

15 nous permettre d'identifier le gene 7?paH fonctionnel. 
11^.8- Analyse de la sequence de 5,2 kb 

L'insert de 5,2 kb du plasmide P 5kbC est sequence. Une recherche d'homologie 
nucleique (BLASTN) permet d'identifier ainsi trois parties dans l'insert La premiere 
partie comprise entre les bases N° 1 et 1465 est parfaitement homologue d'une partie du 
20 plasmide Birmingham IncP-alpha. II s'agit done vraisemblablement dWe sequence 
issue de pLAFR5. Une seconde partie nucleique comprise entre les bases N° 1466 et 
1695 presente une homologie parfeite avec une partie du plasmide de clonage 
M13mp8/pUC8. Cette sequence fait done encore partie du pLAFR^-5 ; en effet le multi- 
site de clonage de pLAFR-5 provient de pUC8 (Keen et al., 1988). Ainsi, les sites Eco 
25 PJ et Sma I (Figure 7) en position respective 1689 et 1695 Sont vraisemblablement les 
sites de clonage du pLAFR-5. La troisieme partie, comprise entre les bases 1 696 et 5264 
(soit 3568 pb) ne presente pas d'homologies fortes. Cette partie d'ADN provient du 
genome de P. acidovorans. Lorsque la sequence de 5^ kb est analysee en utilisant 
l'agorithme BLASTX, on identifie des proteines probables (Figure 7). Ainsi la proteine 
30 codee par le gene 1 presente de faibles homologies avec a des beta-lactamases, des 
dehydrases et des cyclases. La proteine purifiee est codee par le gene 2 puisque l'on 
retrouve les sequences codant les peptides internes precedemment obtenus ; e'est done 
vraisemblablement la 4-HPA 1-hydroxylase. Les alignments proteiques montrent que 
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cette proline presents quelques homologies ayec des oxygenases et des hydroxylases. 
La proteine potentiellement codee par le gene 3 ne presente pas d'homologies avec les 
bases de donnees. Enfin le gene 4 code vraisemblablement un rSgulateur d'op6ron. 

Faisons maintenant k une analyse plus fine du gene hpaH. D'aprSs la sequence 
5 prot^ique N-terminale obtenue, le codon initiation ATG de la proline 4-HPA 1- 
hydroxylase se trouve en fait 78 pb en aval d'un codon initiateur GTG en phase avec 
PATG. La sequence Shine-Dalgarno AGGA, permettant la fixation des ribosomes, est 
retrouv6e en amont de TATG initiateur mais pas en amont du codon initiateur GTG ; ce 
qui confirme que la region codante commence au codon initiateur ATG. La portion 

10 comprise entre les codons GTG et ATG ne correspond done vraisemblablement pas h 
une preproteine. Ainsi defini, le gene hpaH est long de 1737 pb et se termine par le 
codon stop TGA. Le gene est constitu£ a 70,9 % de bases GC. 

Maintenant que nous avons defini avec precision les limites du gene hpaH, 
analysons le produit de sa traduction : la proteine HPAH 

15 EL2.9- Analyse de la proteine HPAH 

La sequence hpaH est traduite en utilisant le syteme universel des codons. Nous 
obtenons ainsi une proteine de 563 acides amines, ce qui repr&sente un poids 
mol6culaire de 62,2 kDa. Les recherches d'homologies proteique (BLASTP) montre que 
PHP AH presente environ 15 a 25 % d'identite essentiellement avec des proteines 

20 d'organismes a Gram positif codant pour des activites enzymatiques apparemment tres 
differentes de celle recherchee. Ainsi on retrouve une oxygenase de Streptomyces 
argillaceus, la 3-(34iydroxy-ph6nyl)propionate hydroxylase (EC 1.14.13.-) d\£ coli, la 
2.4-dihydroxybenzoate monooxygenase de Sphingomonas sp. 9 Penzyme catalysant la 6- 
hydroxylation de la tetracycline chez Streptomyces aureofaciens, une oxygenase 

25 potentielle de Streptomyces fradiae. En fait, PHPAH pr&ente des homologies avec les 
proteines de la famille des phenol mpnooxyg6nases (pheA) et celles de la famille des 
2,4-dichlorophenol hydroxylase QfdB). L'alignement correspondant aux prolines 
precitees est r£alis6 en utilisant Palgoritme ClustalW (Figure 8), H permet de mettre en 
evidence des boites tres conserves. On relevera entre autre trois motifs d'interaction 

30 avec le FAD. Le premier (GXGXXG) correspond au motif structurel p-a-0 qui permet 
Pinteraction de la partie ADP du FAD avec la proteine. Le deuxieme motif (A/C)DG est 
impliqu<§ dans la fixation du FAD tandis que le troisieme motif 
G ( R) VXX (A) GD (A) XH permet Pinteraction avec la partie flavine du FAD. Bien que 
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l'enzyme utilise 4u. NADH, H* le site de fixation corresponds (GDH) n'est pas 
identifie. Cette absence de site de fixation au NADHJT est une caracteristique souvent 
observee chez d'autres monooxygenases a FAD. Enfin, on observe un motif 
(DXXXLXWKLX XXXXXXXXXX LLXXYXXER) que l'on retrouve aussi chez d'autres 
5 hydroxylases (Ferrandez et at, 1997), mais dont la signification n'est pas eclaircie. Bien 
que la 3-(3-hydroxyphenyl>propionate hydroxylase d'R coli catalyse une reaction 
d'hydroxylation sur un substrat structureUement proche du 4-HPA, les informations 
acquises par ces analyses bioinformatiques ne permettent pas de s'assurer que nous 
avons bien identifie la 4-HPA 1 -hydroxylase. La seule maniere de le faire, c'est 
10 d'exprimerle gene ApaH et d'etudier son activite enzymatique. - - 

Identite des prolines impliquees dans I'activite 4-HPA 1 -hydroxylase 
n^.10.1- Expression du gene hpgtt codant la 4-HPA 1-Hydroxylase 
Afin de confirmer que le gene hpaYi code I'activite 4-HPA 1 -hydroxylase, il est 
necessaire d'exprimer le gene. Pour ce faire, une strategic de clonage en deux etape est 
15 utilisee permettant d'eliminer les genes N° 1 et 3 et de placer le gene hpall sous la 
dependance du promoteur lac du vecteur originel pBBRlMCS-Gm-Not-U. Le plasmide 
obtenu est denomme pBBRlMCS FT12A1. Un extrait brut est realise a partir d'une 
culture sur milieu riche de Pi putida transformee avec ce plasmide. La recherche 
d'activite par spectrophotometrie (a 340 et 292 nm) montre que le clone possede certes 
I'activite NADH^T oxydase induite par l'ajout de 4-HPA, mais ne possede pas la 
capacite de synthese de l'homogentisate a partir du 4-HPA. En revanche on observe 
l'apparition d'une molecule Z ayant un temps de retention tres proche (tr ^1^ minutes 
versus 1,4 minutes) mais un spectre UV tres different de celui de l'HGA. Nous posons 
l'hypothese que 1'HPAH oxyde le NADHJT pour reduire son cofecteur FAD. La 
25 reoxydation du FAD se feit au detriment du 4-HPA puisque c'est l'ajout du 4-HPA qui 
initie la reaction. Le 4-HPA est done convertit en metaboUte Z. Le spectre UV de ce 
metabolite suggere que le cycle n'est plus aromatique mais pent etre cependant insature. 
Nous presentons en figure 2 une hypothese structurale pour le metabolite Z. Cette 
experience montre que le promoteur lac est fonctionnel chez P. putida en absence 
30 d'inducteurIPTG, ce qui suggere que le represseux /acl est natureUement absent chez i». 
putida. Nous demontrons en outre que la proteine initialement purifiee (HPAH) est 
reeUement une NADHJT oxydase dependante du 4-HPA qui convertit le 4-HPA en un 
metaboUte Z. La HPAH ne produit pas d'HGA. B est done necessaire d'identifier la ou 
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les proteines partenaires de cette NADHJHP oxydase dependante du 4-HPA et dont 
l'ajout permet de restorer F activity 4-HPA 1 -hydroxylase. 

IL2. 1 0.2- Identification de la proteine HPAC par gel filtration 
Nous avons vu que Pactivitd 4-HPA 1 -hydroxylase disparaissait lors de la 
5 purification de PHPAH sur colonne d'affinite Red. Nous posons done 1 -hypothese que 
la ou les proteines partenaires de la NADHJI+ oxydase dependante du 4-HPA n'ont pas 
&t£ retenus par la resine d'affinite Red 120 agarose et sont done r6cuper6es dans le 
"flow-through". Nous decidons done de purifier le "flow-through" et de rechercher la ou 
les prot&nes qui ajoutees a la HP AH permettent de restorer Pactivite 4-HPA 1- 

10 hydroxylase. Pour ce faire, le "flow-through" est concentree par ultrafiltration 
(Macrosep™ 10K) puis chargSe sur une colonne de gel filtration S75. Un d6bit de 1 
mL.min" 1 est appliqu6 et les fractions de 1 mL sont collectees. On r&lise alors des 
reactions enzymatiques mettant en presence 50 ^iL de chaque fraction et 10 \xL d'HPAH 
prealablement purifie sur colonne Red , dans les conditions reactionnelles normales. Les 

15 reactions stoppees sont alors analysees par HPLC. On observe que les fractions 90 k 
108, lorsque additionnees a de la proteine HPAH, permettent de produire davantage du 
metabolite Z. La production du metabolite Z est detectee dans ces mSme fractions en 
Fabsence d'apport d'HPAH. Par ailleurs, sur les gels d'acrylamide correspondants k ces 
fractions, nous observons une proteine de poids moleculaire equivalent a HPAH. Nous 

20 concluons que le "flow-through" contenait encore un peu de proteine HPAH. Lorsque 
les fractions 109 a 143 sont additionnees a de la proteine HPAH, on observe la 
production d'HGA. Plus la production d'HGA est forte, plus celle du metabolite Z est 
faible. Le maximum de production d'homogentisate est obtenu pour les fractions 116 k 
128. Le depot sur gel acrylamide de des fractions comprises entre 95 et 145 montre 

25 qu'une proline est fortement enrichie dans les fractions 109 a 143, e'est k dire que le 
profil chromatographique de cette proteine coincide avec le profil de production 
d'HGA. Nous d6cidons de d^nommer cette proteine HPAC. La proteine HPAC est 
excisees du gel puis micros6quenc6e en N-terminal. La sequence obtenue, MTTKTFA, 
montre que cette proline est codee par le gene 1 (Figure 7) que nous denommons 

30 dor6navant hpaC. Cette experience montre que Pactivit6 4-HPA 1-hydroxylase 
implique deux prolines, PHPAH et 1'HPAC. Cependant, nous n'avons pas dSfini la 
nature de Pinteraction entre ces deux prolines : (1) HPAH et HPAC sont elles toutes 
deux des enzymes ou bien (2) est-ce FHPAH qui possede une activit6 en2ymatique 
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modifiable en foactioa^de rinteraction avec l'HPAC. 

IL2.10.3- Nature des interactions entre HPAH et HPAC 
L'experience precedente demontre que les proteines HPAH et HPAC sont 
necessaires pour reconstituer l'activite 4-HPA 1 -hydroxylase. Deux hypotheses pour 
5 expfiquer le idle respectif de ces proteines sont posees. Dans ce paragraphe nous 
presentons les resultats qui suggerent que l'HPAC est une enzyme a part entiere. Les 
fractions 100, 101 et 102 de la gel filtration sont rassembles. Elles cOntiennent la HPAH 
c'est a dire l'activite NADILH+ oxydase qui permet de produire le metabolite Z a partir 
du 4-HPA. Par ailleurs, les fractions 123, 124 et 125 de la gel filtration sont 
10 rassemblees. Elles contiennent la HPAC Differentes reactions enzymatiques sont 
realisees en utilisant l'HPAH et/ou l'HPAC. Ces reactions sont reahsees en deux temps. 
Une premiere reaction est realisee avec 1'HPAH (respectivement HPAC), elle est 
stoppee au bout de 30 minutes par un traitement thermique (100°C, 10 min). On ajoute 
alors la HPAC (respect. HPAH) et la reaction est poursuivie pour 30 minutes. La 
15 reaction est finalement arretee par un ajout d'acide perchlorique. Des reactions sont 
aussi realisees en remplacant l'une des enzymes par de l'eau. Enfin, des experiences 
equivalentes sont realisees en filtrant les reactions sur Nanosep™ 1 0 kD (Pall Filtron) au 
lieu de les bouillir. 

Le tableau N°l synthetise les resultats obtenus. 
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Experience N° 


"Enzyme" N°l 


"Enzyme"N°2 


Metabolite observe 




HPAH, HPAC 


/ 


HGA 


A 


HPAH 


H 2 0 


metabolite Z 


B 


HPAH 


HPAC 


HGA 


C 


H 2 0 


HPAC 


/ 


D 


HPAC 


H 2 0 


/ 


E 


HPAC 


HPAH 


metabolite Z 


F 


H 2 0 


HPAH 


Metabolite Z 



Nous observons que la seule maniere de produire de PHGA c'est d'avoir les 
deux proteines HPAH et HPAC simuhanement ou successivement dans cet ordre. 
Lorsque l'HPAH est seule, ou lorsque l'HPAC est introduite avant 1'HPAH, seul le 
metabolite Z est detectable. Enfin, la proteme HPAC n'a aucune activity enzymatique 
25 sur le 4-HPA. Ces resultats suggerent que le metabolite Z est un intermediaire 
reactionnel. L'HPAH convertirait le 4-HPA en metabolite Z, cette reaction permettant 
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Poxydation du NADH,H*. Le metabolite Z serait alors convertit en HGA par la HPAC. 
Les interactions physiques entre les deux prot&nes n'apparaissent pas necessaires 
puisque la prot&ne HPAH pent dire d6natur£e ou £limin6e par filtration avant ajoirt de 
THPAC. Nous avons montre in vitro que FactivitS 4-HPA 1 -hydroxy lase d6pendait des 
5 proteines HPAC et HPAH. Cependant la proline HPAC n'est pas pure en sortie de gel 
filtration, elle est seulement enriehie. n reste done possible qu'en reality se soit une 
autre proline contenue dans cet extrait enrichi qui convertisse le metabolite Z en HGA* 
Pour eliminer les doutes, nous d6cidons de doner les deux genes (JipaC et hpaH) sur un 
meme vecteur, nous devrions dans ce cas produire 1' activity 4-HP A 1 -hydroxylase et 

10 done etre capable de faire croitre P. putida sur milieu minimum contenant du 4-HPA 
comme seule source de carbone. 

IL2.10.4- Complementation fonctionnelle de PS putida par hpaH et hpaC 
Le plasmide pLllac2 (Figure 9) est un vecteur pBBRlMCS-Gm R contenant le 
gene hpaC sous la dependance du promoteur de PHPPD de P. fluorescens et en 

15 opposition, le g&ne hpaH sous la dependance d'un promoteur lac. Le plasmide est 
introduit dans P. putida par 61ectroporation. Les bacteries sont alors etal6es sur milieu 
minimum contenant ou non du 4-HPA comme seule source de carbone. Apres 5 jours, 
les colonies sont visibles seulement sur boites contenant le 4-HPA comme seule source 
de carbone. Au bout de 8 jours, les colonies sont de belles tailles. L'ADN plasmidique 

20 extrait a partir de ces colonies confirme la presence du plasmide pLllac2 integre. Par 
ailleurs P. putida est incapable de croitre sur 4-HPA lorsque la bacterie est transformee 
avec le vecteur pBBRlMCS-GM R contenant soit le gene hpaC soit le gene hpaH. La 
complementation fonctionnelle obtenue dans cette experience confirme que les g&nes 
hpaC et hpaH sont necessaires et suffisants pour instaurer Tactivite 4-HPA 1- 

25 hydroxylase recherchee. 

Exemple III: constructions des differentes cassettes d' expression 
cytosolique. 

IBL1 HPAC 

30 Le g&ne HPAC a ete isol6 de Pseudomonas acidovorans par PCR sur un 

plasmide derive (p5kbC) d'une banque cosmidique d'ADN ggnomique, en utilisant les 
oligonucleotides suivants: 

Start ORF1 (AflHI): GCAGGATGCA CATGTCCACC AAGAC 
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ORF1 Fin (Hindlll): CGGACGCAAG CTTGCATCAG CCTTC 
La reaction a 6t6 effectuee selon les conditions standards. Le fragment amplifie 
d-une taille de 993 pb a ete sous-clone dans le plasmide pGEMTeasy (Promega) selon le 
protocole du foumisseur. Le plasmide pOZl 50 ainsi obtenu a ete sequence. La cassette 
obtenue par digestion EcoRI + Spel a et6 clonee dans le plasmide pBluescriptn-KS+ 
ouvert par les memes enzymes pour donner le plasmide pEPA13. Le promoteur CsVMV 
est isole du plasmide pCH27, derive du plasmide pUC 19 contenant la cassette 
d'expression d'un gene de tolerance herbicide sous le controle du CsVMV. Pour cela 
une PGR standard a ete realisee sur thermocycler avec la Pfii polymerase generant des 
bouts francs; 1 cycle de 5 min a 95°C, 30 cycles [95°C 30 sec, 57°C 30 sec, 72°C 1 
min], 72°C 3 min. Les amorces utilisees sont: 

N-CsVMV: GCCCTCGAGG TCGACGGTAT TGATCAGCTT CC introduisant 
les sites Xhol et Bell 

C-CsVMV: CGCTCTAGAA TTCAGATCTA CAAAC (EcoRI) 
Le fragment de 565 pb gener<§ est digen§ par Xhbl+EcoRI avant d*6tte insere 
dans le plasmide pEPA13 prealablement digere par XhoI+EcoRI; le plasmide pEPA14 
est obtenu. Le terminates Nos est isole du plasmide pRDl 1, derive de pBIueScript H- 
SK(-) dans lequel est clonS le terminates Nos, par digestion HindH+Nofl. Le fragment 
de 292 pb obtenu est clone dans le plasmide pEPA14 ouvert par les mSmes enzymes, 
20 donnantpEPA15. 

Cassette pEPAlS = promoteur CsVMV-hpa C- terminateur Nos (Figure 10 ; 
SEQIDNO 19) 

m^. HPAH 

Le gene HPAH a isol6 de Pseudomonas acidovorans par PCR sur un plasmide 
d6xiv6 (p5kbC) d'une banque cosmidique d'ADN genomique, en utilisant les 
oligonucleotides suivants: 

Start ORF2 (Aflin): CAGAGGACGA ACAACATGTC CCACC 
ORF2 Fin 3(HindIII): CTGTGGATGA AGCTTAAGAG GTTGAGGG 
La reaction a ete effectuee selon les conditions standard. Le fragment amplifie 
d'une taille de 1729pb a ete sous-clone bouts-francs dans le plasmide pBIueScript H SK 
digere par EcoRV. Le plasmide pEPA16 ainsi obtenu a ete sequence. Le promoteur 
CaMV 35S est isole du plasmide pCH14, derive du plasmide pBI 121 contenant la 
cassette d'expression GUS: promoteur CaMV 35S-GUS-terminateur Nos. Pour cela une 
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PGR standard a 6t6 realisfe sur thermocycleravec la Pfu polymerase gen£rant des bouts 
francs; 1 cycle de 5 min h 95°C, 30 cycles [95°C 30 sec, 63°C 30 sec, 72°C 1 min], 
72°C 3 min. Les amorces utilises sont: 

N-CaMV : GCATGCCTCG AGCCCACAGA TGG introduisant le site Xhol 
5 C-CaMV: CCACCCGGGG ATCCTCTAGA G introduisant le site BamHI 

Le fragment de 839 pb g6n6r6 est digere par XhoI+BamHI avant d'etre insert 
dans le plasmide pEPA16 prealablement digere par Xhol + Bell; Le plasmide pEPA17 
est ainsi obtenu. Le tenninateur Nos est isote du plasmide pRD 11 par PCR, sous les 
memes conditions que pr6cedemment, pour 1 cycle de 5 min a 95 P C, 30 cycles [95°C 30 
10 sec, 57°C 30 sec, 72°C 1 min], 72°C 3 min., avec les amorces suivantes: - 

N-Nos: CAAGCTTATC GATACCGTCG ACG introduisant HindlH 

C-Nos: GAATTGCGGC CGCAATTCCC GACCTAGGA ACATAG introduisant 
Notlet AvrIL 

Le fragment de 305 pb obtenu est digere par NotI + HindlH avant d'etre clone 
15 dans le plasmide pEPA17 ouvert par les memes enzymes, dormant pEPA18. 

Cassette pEPA18 = promoteur CaMV 35S-hpa H- terminateur Nos (Figure 1 1 ; 
SEQIDN017). 

IIL3. HPPO 

Le gene HPPO a 6X6 isole d'Arthrobacter globiformis par PCR sur le cosmide 2A 
20 issu d'une banque cosmidique d'ADN g6nomique, en utilisant les oligonucleotides 
suivants: 

N-teim-HPPO-Scal: GAATTCAGTA CTTCACT.TAC AGTGTCCGGC 
introduisant les sites de restriction EcoRI et Seal. 

C-term-HPPO- AsuII-XhoI : GAATTCTCGA GTTCGAACAA ACTGAGTAGC 
25 AGCTCA introduisant les sites EcoRI, Xhol et AsuII 

La reaction a ete effectuee selon les conditions standard. Le fragment de 1800 pb 
obtenu est clone dans le vecteur pGEMT-easy (Promega) selon le protocole du 
fournisseur. Le plasmide pOZ151 ainsi obtenu a 6X6 sequence. La cassette obtenue par 
digestion SphI + Xhol a ete clonee dans le plasmide pBBRl-MCS (Gm) ouvert par les 
30 memes enzymes pour donner le plasmide pEPA20. Le promoteur simple histone est 
isol<§ du plasmide pCH9, derive du plasmide pUC19 contenant la cassette d'expression 
de l'EPSPS: promoteur simple histone-intron2-OTP-EPSPS-terminateur Histone. Pour 
cela une PCR standard a et<§ r^aliseeavec Pfu polymerase generant des bouts francs; 1 
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cycle de 5 nun a, 95*0, 5 cycles [95<>C 30 sec y 45°C 30 sec, 72°C 1 nun], 30 cycles 
[95°C 30 sec, 65"C 30 sec, 72°C 1 min], 72°C 3 min. Les amorces utffisees sont 

N-SH: GCTTGCATGC CTAGGTCGAG GAGAAATATG introduilant les sites 
SpWet Avrll 

C-SH: CATGAGGGGT TCGAAATCGA TAAGC 

Le fragment de 970 pb genere est digere par SphI avant d'etre insere dans le 
plasmide pEPA20 prealablement digere par SpH + Seal; Dans le plasmide pEPA21 
obtenu, TATG ^initiation du gene HPPO est recree derriere le promoteur Simple 
Histone. Le terminateur Histone est isole du mgme plasmide pCH9 par PCR, sous les 
memes conditions que precedemment, pour 1 cycle de 5 min a 95°C, 35 cycles [95«C 30 
sec, 55°C 30 sec, 72°C 1 min], 72°C 3 min., avec les amorces suivantes: 

N-Histen CTAGACCTAG GGGATCCCGC GATC ihtroduisant Avrll 
C-Hister: CCCACTAGTG TTTAAATGAT CAGTCAGGCC GAAT mtroduisant 
Spel et Bell. 

Le fragment de 726 pb obtenu est digere par Spel + Avrll avant d'etre clone dans 
le plasmide pEPA21 ouvert par Spel, donnant pEPA22. 

Cassette pEPA22 = promoteur simple mstone-hppO-teminateur histone (Figure 
12;SEQIDN015). 

III.4. Association des genes 
La cassette contenant le gene HPAC est extraite de pEPA15 par digestion Notl et 
clonee dans pEPA18 (Notl+Bspl20l) pour former pEPA19 (Figure 13 ; SEQ ID NO 
21). Ce dernier est digere par Avrll pour doner la cassette extraite dans les sites 
AvrH+Spel de pEPA22. Le plasmide contenant les trois constructions est pEPA23 
(Figure 14 ; SEQ ID NO 22). 

25 HL5. Vecteur binaire 

Afin de transformer les plantes par Agrobacterium, les trois Constructions sont 
extractibles par BcU afin d'etre introduites dans un vecteur binaire d'Agrobactiries. 
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Abreviations : 

3,4-DHPA 

4-HPA 

ADN 

5 APcI 

ARN 

ARNm 

BET 

BLAST 

10 BSA 
c ioo 

CRLD 

Da 

DKN 
15 DMSO 

dATP 

dCTP 

dGTP 

dNTP 
20 dTTP 

DTE 

DTT 

EDTA 

FAD 
25 FPLC 

Gm 20 

HGA 

HPLC 

HPP 
30 HPPD 

HPPO 

IFT 

IPTG 
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acide 3,4-dmydoxyphenylacetique 

adde 4-hydroxyphenylacetique 

acide desoxyribonucl&que 

Ionisation chimique a Pression Atmospherique 

acide ribonucleique 

acide ribonucleique messager 

bromure d'ethidium 

Basic Local Alignment Search Tool 

albumine de serum bovin - 

carbenicilline (100 ug/mL) 

Centre de Recherche La Dargoire 

Dalton 

dicetonitrile de l'isoxaflutole 

dimethylsulfoxyde 

2'd6soxyad£nosine 5'-triphosphate 

2'desoxycytidine 5'-triphosphate 

2'd6soxyguanosine 5 '-triphosphate 

2'-desoxynucleotides 5 '-triphosphate 

2'desoxythymidine 5'-triphosphate 

dithioerithriol 

l,4-dithiothr6itol \ 

acide ethylene diamine t£traacetique 

flavine adenine dinucleotide 

"fast protein liquid chromatography " 

gentamycine (20ng/mL) 

acide homogentisique 

chromatographie liquide haute performance 

acide hydroxyphehylpyruvique 

acide hydroxyphenylpyruvrique dioxygenase 

hydroxyphenylpyruvate oxydase 

isoxaflutole 

isopropyl-p-thiogalactopyranoside 



BNSDOCID: <WO 0236787A2_I_> 



WO 02/36787 

Kn 50 

kb 

Km 

L-DOPA 
5 LB 
min 
mj 

MNDD 
MndD 
10 NAD + (H^) 

OGM 

OTP 

pb 

15 pBBRl MCS-Gm 
PCR 
ppm 
PVDF 
qsp 
20 Q.r. 
Rif 100 
RMN 
SDS 
sec 
25 TBE 
TBV 
TFA 
TrEMBL 
bank) 
30 Tris 
U.V. 
vs 

X-gal 
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kanamycine (50 ug/mL) 
kilo bases 

eonstante de Michaelis Menten 

3,4-dmydroxyphenyIalanine 

milieu de Luria Bertani 

minutes 

milli-joules 

manganese dependant dioxygenase 
gene codant la MNDD 

nicotinamide adenine dinucleotide (fonne oxydee/fbrme 
reduite) 

Organismegenetiquementmodifie 

Optimised Transit Peptid ; peptide de transit optimist 

paire de bases 

plasmide pBBRlMCS resistant a la gentamycine 

reaction de polymerisation en chaine 

partie par million; mgX* 1 

polyvinytene difluoride 

quantite suffisante pour 

coefficient respiratoire 

Rifampicine (100 ug/mL) 

resonance magnetiqiie nucleaire 

dodecyle sulfate de sodium 

seconde 

tris borate EDTA 
" tobacco etch virus " 
acide triflubroacetique 

banque genomique EMBL traduite {translated EMBL 

tris(hydroxymemyl)aminom6thane 
ultra-violet 

versus 

5-bromo-4-chloro-3-P-D-galactopyranoside *-■ 



WO02/36787 62 PCT/FRO 1/03364 

References ____ 

Abe, H. ; Uchiyama, M. ; Satoj, R. (1974) Isolation of phenylacetic acid and its p- 
hydroxyderivative as auxin-like substances from Undaria pinnatifida. Agric. BioL 
Chem. 38 : 897-898 

5 Adachi, K.; Takeda, Y.; Senoh, S.; Kita, H. (1964) Metabolism of p- 

hydroxyphenylacetic acid in Pseudomonas ovalis.Biochem. Biophys. Acta 93: 483-493 

Appert, C; Logemann, E.; Hahlbrock, IL; Schmid, J.; Amrhein, N.; (1994) 
Structural and catalytic properties of the four phenylalanine ammonia-lyase isoen2ymes 
from parsley (Petroselinum crispum Nym.); Eur. J. Biochem.; 225:491-499 
10 Arunachalam, U.; Massey, V.; Vaidyanathan, C.S. (1992) p-hydroxyphenylaeetate 

3-hydroxylase. J. BioL Chem. 267: 25848-25855 

Arunachalam, U.; Massey, V. (1994) Studies on ther oxidative half-reaction of p- 
hydroxyphenylacetate 3-hydroxylase. J. BioL Chem. 269: 1 1795-1 1801 

Arunachalam, U.; Massey, V.; Miller, S.M. (1994) Mechanism of p- 
15 hydroxyphenylacetate 3-hydroxylase. J. Biol. Chem. 269: 150-155 

Aubert, S. (1994) Effet multiples du glycerol sur le m6tabolisme de la cellule 
vegetale non chlorophylienne. These. Universite Joseph Fourier .— Grenoble - France 

Aubert, S.; Gout, E.; Bligny, R.; Marty-Mazars, D.; Barrieu, F.; Alabouvette, J; 
Marty, F.; Douce, R. (1996a) Ultrastructural and biochemical characterization of 
20 autophagy in higher plant cells subjected to carbon deprivation: control by the supply of 
mitochondria with respiratory substrates. J. Cell BioL 133: 1251-1263 

Aubert, S.; Alban, C; Bligny, R.; Douce, R. (1996b) Induction of beta- 
methylcrotonyl-coenzyme A carboxylase in higher plant cells during carbohydrate 
starvation: evidence for a role of MCCase in leucine metabolism. FEBS Lett. 383: 175- 
25 180 

Aubert, S.; Bligny, R.; Douce, R. (1996c). NMR studies of metabolism in cell 
suspensions and tissue cultures, in " Nuclear Magnetic Resonance in Plant Physiology 99 
(Y. Shachar-Hill and P. Pfeffer, Eds.), pp.109-154, American Society of Plant 
Physiologists, Rockville, USA. 
30 Aubert, S.; Bligny, R.; Day, D.A.; Whelan, J.; Douce, R. 1997. Induction of 

alternative oxidase synthesis by herbicides inhibiting branched-chain amino acid 
synthesis. Plant J. 11:649-657 

Aubert, S. ; Curien, G. ; Bligny, R. ; Gout, E* ; Douce, R. (1998) Transport, 



BNSDOCID: <WO 0236787A2_I_> 



WO 02/36787 

63 PCT/FR01/03364 

compartimentation and metabolism of homoserine in higher plant cells. Carbon-13 and 
phosphorus-3 1-nuclear magnetic resonance statics. Plant Physiol 116 : 547-557 

Aubert, S.; Pallett, K. (2000) Combined use of »C- and "F-NMR to analyse the 
mode of action and the metabolism of the fluoride herbicide isoxaflutole. Plant Physiol. 
5 Biochem., 38 : 517-523 

Ausubel, F.M.; Brent, R.; Kingston, R.E.; Moore, D.D.; Seidman, J.G.; Smith, 
J.A.; Struhl, K. (1995) Current protocols in molecular biology(volume 1-4). Wiley ed., 
Massachusetts General Hospital &Harward Medical School. 

Bate, N.J.; Orr, J.; Ni/W.; Meromi, A; Nadler-Hassar, T.; Doerner, P. W.- Dixon, 
10 ILA.; Lamb, C.J.; Elkind, Y. (1994) Quantitative relationship between phenylalanine 
ammonia-lyase levels and phenylpropanoid accumulation in transgenic tobacco 
identifies a rate-detennimng step in natural product synthesis. Proc. NatL Acad. Sci 
USA 91: 7608-12 

Battersby, A.R.; Chrystal, E.J.; Staunton, J. (1980) Studies of enzyme-mediated 
15 reactions. Part 12. Stereochemical course of the decarboxylation of (2S)-tyrosine to 
tyramine by microbial, mammalian and plant systems. J. Chem. Soc. 1: 31-42 

Bickel, H.; Palme, L.; Schultz, G. (1978) Incorporation of shikimate and other 
precursors into aromatic amino acids and prenylquinones of isolated spinach 
cMoroplasts. Phytochemistry. 17: 119-124 
20 Bickel, H.; Buchholz, G.; Schultz, G* (1979) On the compartimentation of the 

biosynthesis of aromatic amino acids and prenylquinones in higher plants. In Advances 
in the biochemistry and physiology of plant lipids y Appelqvist, L.A. Liljenberg, C, eds. 
Elsevier, Amsterdam pp 369-375 

Biswas, I. ; Gruss, A. ; Ehrlich, SJO. ; Maguin, E. (1993) High-efficiency gene 
25 inactivation and replacement system for Gram-positive bacteria. J. Bacterial 175 • 
3628-3635 

Blakley, E.R. (1977) The catabohsm of L-tyrosine by mArthrobacter sp., Can. J. 
Microbiol. 23 : 1128-1139 

Bligny, R. ; Leguay, J.J. (1987) Techniques of cell cultures. Meth. Enzymol 148 • 

30 3-16 

Boehringer Mannheim (1995) The DIG system user's guide for filter 
hybridization 

Boldt, Y^.; Sadowsky, M.J.; Ellis, LBM.; Que, L.; Wackett, LJ». (1995) A 



BNSDOC4D: <Wt> 



0236787A2.L> 



WO 02/36787 ^ PCT/FR01/03364 

Manganese-dependent Dioxygenase from Arthrobacter globiformis CM-2 belongs to 
the major extradiol dioxygenase femily. J. Bacteriol. 177: 1225-1232 

Borresen, T ; Klausen, N.K. ; Larsen, L.M. ; Sorensen, H. (1989) Purification and 
characterisation of tyrosine decarboxylase and aromatic— L-amino-acid decarboxylase. 
5 Biochem. Biophys. Acta 993 : 108-115 

Bradford, MJM. (1976) A rapid and sensitive method for the quantification of 
microgram quantities of protein utilizing the principle of protein-dye binding. Anal 
Biochem. 72 : 248-254 

Brouquisse, R; James, F.; Pradet, A.; Raymond, P. (1992) Asparagine 
10 metabolism and nitrogen distribution during protein degradation in sugar-starved maize 
root tips. Planta. 188: 384-395 

Callis, J. (1995) regulation of proteine degradation. Plant Cell. 7 : 845-857 

Campos-Garcia J., Najera R, Camarena L., Soberon-Chavez G. (2000) The 
Pseudomonas aeruginosa motR gene involved in regulation of bacterial motility. FEMS 
15 Microbiol Lett. 184: 57-62 

Chan, M.T.; Chao, Y.C.; Yu, S.M. (1994) Novel gene expression system for plant 
cells based on induction of alpha-amylase promoter by carbohydrate starvation. J. Biol 
fhem. 269: 17635-17641 

Chang, A.K. ; Duggleby, R.G. (1997) Expression, purification and 
20 characterization of Arabidopsis thaliana acetohydroxyacid synthase. Biochem. J. 327 : 
161-169 

Chevalier, C; Bourgeois, E.; Just, D.; Raymond^ P.; (1996) Metabohc regulation 
of asparagine synthetase gene expression in maize (Zea mays L.) root tips. Plant J. 9: 1- 
11 

25 Chua, N.H. (1980) electrophoretic analysis of chloroplast proteins. Methods 

Enzymol. 69 : 434-446 

Coligan, J.E.; Dunn, B.M.; Ploegh, H.L.; Speicher, D.W.; Wingfield, P.T. Current 
protocols in protein science. Wiley ed. 

Coligan, J.E. (1997) Chapter 11 : Chemical analysis in Current Protocols in 
30 Protein Science. Coligan, J.E. ; Dunn, B.M. ; Ploegh, HX. ; Speicher, D.W. ; Wingfield, 
P.T. (eds.) Wiley. Vol. 1. 

David, C; Daro, A; Szalai, E.; Atarhouch, T.; Mergeay, M.(1996) Formation of 
polymeric pigments in the presence of bacteria and comparison with chemical oxidative 



BNSDOCID: <WO 0236787A2_I_> 



10 



WO02/36787 65 PCT/FR01/03364 

coupling-JJ. CataboHsm of tyrosine and hydroxyphenylacetic acid by Alcaligenes 
eutrophus CH34 and mutants. Eur. Pofym. J., 32: 669-^679 

De Lorenzo V., Herrero M., Jakubzik U., Timmis K-N. (1990) Mini-Tn5 
transposon derivatives for insertion mutagenesis, promoter probing, and chromosomal 
insertion of cloned DNA in gram-negative eubacteria. JBacteriol 172: 6568-6572 

D'Souza LM, Willson RC, Fox GE (2000) Expression of marker RNAs in 
Pseudomonas putida Curr Microbiol. 40: 91-95 

Despeghel, LP. ; Delrot, S. (1983) Energetics of amino acids Uptake by Vicia faba 
leaf tissue. Plant Physiol. 71 : 1-6 

Dey & Harborne (1997) Plant Biochemistry, page 389, Ed. PM. Dey &J3. 
Harbome, Academic Press 

Fedi S., Brazil D., Dowling D.N., O'Gara F. (1996) Construction of a modified 
mini-Tn5 lacZY non-antibiotic marker cassette: ecological evaluation of a lacZY 
marked Pseudomonas strain in the sugarbeet rhizosphere. FEMS Microbiol Lett. 135: 
15 251-257 

Feretti, L. ; Sgaramella, V. (1981) Specific and reversible inhibition of the blunt 
end joining activity of the T4 DNA ligase. Nucleic Acid Res. 9 : 3695-3705 

Ferrandez, A; Garcia, J.L. ; Diaz, E. (1997) Genetic characterization and 
expression Jn heterologous hosts of the 3-(3-hydroxyphenyl)-propionate catabolic 
20 pathway of Escherichia coli K\2. J. Bacteriol. 179:2573-2581 

Filleur, S.; Daniel-Vedele, F. (1999) Expression analysis of a high arfinity nitrate 
transporter isolated from Arabidopsis thaliana by differential display. Planta 207: 461- 
469 

Flodin, C; Whitfield, F.B. (1999) 4-hydroxybenzoic acid: a likely precursor of 
25 2^,6-iiibromophenol in ZJlvalactuca.Phytochemistry. 51: 249-255 

Fltigge, U.-I. (1998) MetaboUte transporters in plastids. Curr. Opinion Plant 
Biotech., 1: 201-206 

Folch, J. ; Lees, M. ; Sloane-Stanley, GJI. (1957) A simple method for the 
isolation and purification of lipids from animal tissues. J Biol Chem 226: 497-509 

Frommer, W.B. ; Kwart, M. ; Hirner, B.; Fischer, W.N. ; Hummel, S.; 
Ninnemann, O. (1994) Transporters for nitrogenous compounds in plants. Plant Mol. 
Biol. 26 : 1651-1670 

Gaines, G.G.; Byng, G.S.; Whitaker, RJ.; Jensen, RA. (1982) L-tyrosine 



30 



BNSOOCID: <WO Q236787A2 I > 



WO 02/36787 6fi PCT/FR01/03364 

regulation and biosynthesis via arogenatedehydrogenase in suspension-cultured cells of 
Nicotiana sttvestris speg. et comes. Planta, 156: 233-240 

Galan, B. ; Diaz, E. ; Prieto, MA (2000) Functional analysis of the small 
component of the 4-hydroxyphenylacetate 3-monooxygenase of Escherichia coli W : a 
5 prototype of a new flavin :NAD(P)H reductase subfamily. J, BacterioL 182 : 627-636 

Garcia,!.; Rodgers, M.; Lenne, C; Rolland, A.; Sailland, A.; Matringe, M. (1997) 
Subcellular localisation and purification of a p-hydroxyphenylpyruvate dioxygenase 
from cultured carrot cells and characterisation of the corresponding cDNA. Biochem. J. ; 
325:761 

10 Garcia, L; Rodgers, M. ; PSpin, R. ; Ksieh, T.-F., Matringe,- M. (1999) 

Characterization and subcellular compartmentation of recombinant 4- 
hydroxyphenylpyruvate dioxygenase from Arabidopsis in transgenic tobacco. Plant 
Physiol. 119: 1507-1516 

Gazzarini, S.; Lejay, L.; Gojon, A.; Ninnemann, O.; Frommer, W.B.; von Wiren, 

15 N. (1999) Three functional transporters for constitutive; diurnally regulated and 
starvation-induced uptake of ammonium into Arabidopsis roots. Plant Cell . 11: 937- 
948 

Genix, P.; Bligny, R.; Martin, J.B.; Douce, R. (1990) Transient accumulation of 
asparagine in sycamore cells after a long period of sucrose starvation. Plant Physiol. 94: 
20 717-722 

Georgalaki, M.D. ; Sarantinopoulos, P. ; Ferreira, E.S. ; De Vuyst, L. ; 
Kalantzopoulos, G. ; Tsakalidou, E. (2000) Biochemical properties of Streptococcus 
macedonicus strains isolated from Greek Kasseri cheese. J. Appl Microbiol 88 : 817- 
825 

25 Goodchild, J A.; Givan, C.V. (1990) Influence of ammonium and external pH on 

the amino and organic acid content of suspension culture cells of Acer pseudoplatanus 
L. Physiol plant 78: 29-37 

Goodwin & Mercer (1988) Introduction to plant biochemistry, 2 nd edition. 
Pergamon Press p. 356 

30 Gout, E.; Bligny, R.; Genix, P.; Tissut, M.; Douce, R. (1992). Effect of glyphosate 

on plant cell metabolism. 31 P and 13 C NMR studies. Biochimie. 74: 875-882 

Greenberg, D.M. ( ) Metabolic pathways. Amino acids and tetrapyrroles, 3 rf 
edition, Academic Press, vol. HI : p. 148 



BNSDOCIO: <WO„ . . . . 0236787A2 I > 



WO 02/36787 _ 

67 PCT/FR01/03364 

Gross, D. J[1S75) Growth regulating substances of plant origin. Phytochemistry. 
14:2105-2112 

Grunstein, M. ; Hogness, D.S. (1975) Colony hybridization : "a method for the 
isolation of cloned DNAs that contain a specific gene. Proc. Natl Acad Sci. U.&A. 72 : 
5 3961-3965 

Hahlbrock, K.; Scheel, D.; (1989) Physiology and molecular biology of 
phenylpropanoid metabolism. Ann. Rev. Plant Physiol. Plant Mol. Biol ; 40: 347-369 

Hareland, WA; Crawford, R.L.; Chapman, P.J.; Dagley, S. (1975) Metabolic 
function and properties of 4-hydroxyphenylacetic acid 1 -hydroxylase from 
10 Pseudomonas acidovorans. J.Bacteriol, 121: 272-285 

Hess, J.L. (1993) Vitamine E, a-TocopheroIs. In Antioxidans in Higher Plants 
Edited by Alscher, R.; Hess, J.; Boca Raton: CRC: p.:l 1 1-134 

Hill, CM. ; Duggleby, R.G. (1998) Mutagenesis of Escherichia coli 
acetohydroxyacid synthase isoenzyme II and characterization of three herbicide- 
15 insensitive forms. Biochem. J. 335 : 653-661 

Homeyer, U.; Litek, K.; Huchzermeyer, B.; Schulte, G. (1989) Uptake of 
phenylalanine into isolated barley vacuoles is driven by both tonoplast adenosine 
triphosphatase and pyrophosphatase. Plant Physiol. 89: 1388-1393 

Jones, D.; Keddie, RM. (1991) The genus Arthrobacter, In: The procaryotes 
20 (Balows, A.; TrOper, H.G.; Dworkin, M;; Harder, W.; Schleifer, K.H., eds.) 2nd eds., 
Springer-Verlag, New-York 

Journet E.P., Bligny R, Douce R. (1986) Biochemical changes during sucrose 
deprivation in higher plant cells. J. Biol. Chem. 261: 3193-3199 

Junge, K.; Gosink, J.J.; Hoppe, H.-G; Staley, J.T. (1998) Arthrobacter, 
25 Brachybacterium and Planococcus isolates identified from antarctic sea ice brine. 
Description of Planococcus mcmeekinii, sp. nov.. System. Appl. Microbiol, 21: 306-3 14 
Kaiser, G. ; Martinoia, E. ; Wiemken, A. (1982) Rapid appearance of 
photosynthetic products in the vacuoles isolated from barley mesophyll protoplasts by a 
new fast memod. Z Pflanzenphysiol. 1 07 : 1 03-1 1 3 
30 Keen, N.T., Tamaki, S., Kobayashi, D., Trollinger, D., (1988), Improved broad- 

host-range plasmids for DNA cloning in gram-negative bacteria, Gene, 70, 191-197 

KindL H. (1969) Biosynthesis and metabolism of hydroxyphenylacetic acids in 
higher plants. Eur. J. Biochem.. 7: 340-347 



BNSPOCID:<WO 



_ 0236787 A2 I > 



WO 02/36787 6g PCT/FRO 1/03364 

Koch, C; Schumann, P.; Stackebrandt, E. (1995) Reclassification of Micrococcus 
agilis (Ali-Cohen 1889) to the genus Arthrobacter as Arthrobacter agilis comb. nov. 
and emendation of the genus Arthrobacter. Int. J. Syst. Bacteriol 45: 837-839 

Kovach ME, Phiffips RW, Elzer PH, Roop RM 2nd, Peterson KM (1994) 
5 pBBRlMCS: a broad-host-range cloning vector. Biotechniques 16: 800-802 

Kovach ME, Elzer PH, Hill DS, Robertson GT, Farris MA, Roop RM 2nd, 
Peterson KM (1995) Four new derivatives of the broad-host-range cloning vector 
pBBRlMCS, carrying different antibiotic-resistance cassettes; Gene 166: 175-176 

Kruk, J.; Strzalka, K. (1998) Identification of plastoquinone-C in spinach and 
10 maple leaves by reverse-phase high-performance liquid chromatography. 
Phytochemistry 49: 2267-2271 

Laemmli, U.K. (1970) Cleavage of structural proteins during the assembly of the 
head of bacteriophage T4. Nature. 227: 680-683 

Lamport, D.T.A.; Northcote, D.H. (1960) Hydroxyproline in primary cell walls of 
15 higher plants. Nature: 188: 665-666 

Laursen, R.A. (1971) Solid-phase Edman degradation. An automatic peptide 
sequencer. Eur. J. Biochem. 20 : 89-102. 

Li, Z.-C; Bush, D.R. (1990) ApH-dependent amino acid transport into plasma 
membrane vesicles isolated from sugar beet leaves. I. Evidence for carrier-mediated, 
20 electrogenic flux through multiple transport systems. Plant Physiol 94: 268-277 

Li, Z.-C; Bush, D.R. (1991) ApH-dependent amino acid transport into plasma 
membrane vesicles isolated from sugar beet (Beta vulgaris L.) leaves. II. Evidence for 
multiple aliphatic, neutral amino acid symports. Plant Physiol. 96: 1338-1344 

Liu, D.-L.; Xu, S.-X.; Wang, W.-F. (1998) a novel lignan glucoside from 
25 Forsythia suspensa Vahl. X Chin Pharmaceut. Sci. 7: 49-51 

Ldffelhardt, W. (1977) The biosynthesis of phenylacetic acids in blue-green alga 
Anacystis nidulans: evidence for the involvement of a thylakoid-bound L-amino acid 
oxidase. Z Naturforsch. 32: 345-350 

Luscombe, B.M.; Palett, K.E.; Loubierre, P.; Millet, J.-C; Melgarejo, J.; Vrabel, 
30 T.E. (1995) RPA 201772 a novel herbicide for broad leaf and grass weeds control in 
maize and sugar cane, Proc. Brighton Crop Prot. Conf Weeds, 1: 35 

Luscombe, BM.; Pallett, K.E.; (1996) Isoxaflutole for weed control in maize, 
Pesticide Outlook, December, 29 



3NSDOCID: <WO 0236787 A2. 1 > 



WO 02/36787 69 PCT/FR01/03364 

Lutterbaclj^R.jsStockigt, J. (1994) in vivo investigation of plant cell metabolism 
by means of natural-abundance 13 C-NMR spectroscopy. Helv. Chim. Acta, 77: 2153- 
2161 - 

Lutterbach, R.; St6ckigt, J.;(1995), Dynamics of the biosynthesis of 
5 methylursubin in plant cells employing in vivo ,3 C-NMR without labelling. 
Phytochemistry, 40: 801-806 

MacLaughlin, P.J.; Weihrauch, J.L. (1979) Vitarnine E content of foods. J. Am. 
Diet. Assoc.75: 647-665 

Maniatis, T.; Fritsch, E.F.; Sambrook, J. (1982) Molecular cloning - A laboratory 
10 manual eds Cold Spring Harbor Laboratory - 

Martin, M. ; Gibello, A. ; Fernandez, J. ; Ferrer, E. ; Garrido-Pertierra, A. (1991) 
Catabolism of 3- and 4-hydroxyphenylacetic acid by Klebsiella pneumoniae. J. Gen. 
Microbiol. 132 : 621-628. 

Mayer, M.P. ; Beyer, P. ; Kleinig, H. (1990) Quinone compounds are able to 
15 replace molecular oxygen as terminal electron acceptor in phytoen desaturation in 
chromoplasts of Narcissus pseudonarcissus L. Eur. J. Biochem. 191 : 359-363 

Mayer,MP.; Nievelstein, V.; Beyer, P. (1992) Purification and characterization of 
a NADPH dependent oxidoreductase from chromoplasts of Narcissus pseudonarcissus: 
a redox-mediator possibly involved in carotene desaturation. Plant Physiol. Biochem.M: 
20 389-398 

Mazelis, M. (1980) Amino acid metabolism. In "the biochemistry of plants" 
(Stumpf, PK, Conn, E.E; eds.), vol.5: amino acids and derivatives. Academic press, 
London, New York, pp: 1-55 

Michal, G. - ed.- (1999) Biochemical Pathways, An atlas of biochemistry and 
25 molecular biology, Wiley & Spektrum eds., p. 60 

Miflin, B.J.; Lea, P.J. (1982) Ammonium assimilation and amino acid 
metabolism. In AB. Boulter, B. Parthiers, eds, Encyclopedia of Plant Physiology, Vol. 
14, Nucleic Acids and Proteins in Plants 1. Springer Verlag, Berlin, PP : 5-64 

Moreno-Arribas, V. ; Lonvaud-Funel, A (1999) Tyrosine decarboxylase activity 
30 of Lactobacillus brevis IOEB 9809 isolated from wine and L. brevis ATCC 367. FEMS 
Microbiology Letters. 180 : 55-60 

Moreno-Arribas, V. ; Torlois, S. ; Joyeux, A ; Bertrand, A ; Lonvaud-Funel, A 
(2000) Isolation, properties and behaviour of tyramine-producing lactic acid bacteria 



3NSDOC1D: <WO Q236787A2 I > 



WO 02/36787 70 PCT/FROI/03364 

from wine. J. Appl Microbiol. 88 : 584-593 

Morot-Gaudry, J.F. (1997) Assimilation de Pazote chez les plantes. Aspects 
physiologique, biochimique et moleculaire. INRA Editions. 

Mouillon, J.M.; Aubert, S.; Bourguignon, J.; Gout, E.; Douce, R.; RebeilI6, F. 
5 (1999) 

Glycine and serine catabolism in non-photosynthetic higher plant cells: their role 
in CI metabolism. Plant J. 20: 197-205 

Murashige, T.; Skoog (1962) A revised medium for rapid growth and bio assays 
with tabacco tissue cultures. Physiol. Plant. 15: 473 
10 Negrel, J.; Javelle, F.;(1995); Induction of phenylpropanoid and tyramine 

metabolism in pectinase or pronase elicited cell suspension cultures of tabacco 
(Nicotiana tabacum); Physiologia Plantarum, 95: 569-574* 

Nester, E.W.; Montoya, A.L. (1976) An enzyme common to histidine and 
aromatic amino acid biosynthesis in Bacillus subtilis. J. Bacterid. 126: 699-705 
15 Norris, S.R.; Barette, T.R.; DellaPenna, D. (1995) Genetic dissection of 

carotenoid synthesis in Arabidopsis defines plastoquinone as an essential component of 
phytdene desaturation. Plant Cell 7: 2139-2149 

Pallett, K.E.; Little, J.P.; Sheekey, M.; Veerasekaran, P. (1998) The mode of 
action of Isoxaflutole. I. Physiological effects, metabolism and selectivity. Pestic. 
20 Biochem. Physiol. 62 : 1 13-124 

Prieto, M.A.; Perez-Randa, A.; Garcia, J.L. (1993) Characterization of an 
Escherichia coli aromatic hydroxylase with a bfoad substrat range. J. BacterioL 175: 
2162-2167 

Prieto, M.A.; Garcia, J.L.; (1994) Molecular characterization of 4- 
25 hydroxyphenylacetate 3-hydroxylase of Escherichia colL J. Biol. Chem. 269: 22823- 
22829 

Prieto, M. A. ; Diaz, E. ; Garcia, J.L. (1996) Molecular characterization of the 4- 
hydroxyphenylacetate catabolic pathway of Escherichia coli W : engineering a mobile 
aromatic degradative cluster. J. BacterioL 178 : 111-120 
30 Prieto M.A., Kellerhals M.B., Bozzato G.B., Radnovic D., Witholt B., Kessler B. 

(1999) Engineering of stable recombinant bacteria for production of chiral medium- 
chain-length poly-3-hydroxyalkanoates. Appl Environ Microbiol 65: 3265-3271 

Roberts, J.K.M. (2000) NMR adventures in the metabolic labyrinth within plants. 



BNSDOCJD: <WO 0236787A2_L> 



W ° 02/36787 71 PCT/FH01/03364 

Trends Plant Sci. 5 : 30-34 

Roby, C; Martin, J.B.; Bligny, R; Douce, R. (1987) Biochemical changes during 
sucrose deprivation in higher plant cells. Phosphorus-31 nuclear resonance magnetic 
studies. J. Biol.Chem. 262: 5000-5007 
5 Sailland, A.; Matringe, M.; Rolland, A.; Pallett, K. (1995) Gene de l'hydroxy- 

phenyl pyruvate dioxygenase et obtention de plantes contenant ce gene resistantes aux 
herbicides. WO 96/38567 

Sailland, A., Derose, R (1999) Method for enzymatic preparation of 
homogentisate. WO9934008 A 19990708 
10 Sambrook; Fritsch; Maniatis. Molecular cloning. A laboratory manual, 2 nd edition 

Schroeder, C; Sommer, J.; Humpfer, E.; StSckigt, J. (1997) Inverse correlated »H- 
U C in vivo NMR as a probe to follow the metabolism of unlabelled vanillin by plant cell 
cultures. Tetrahedron* 53: 927-934 

Schoenle, E.J. ; Adams, L.D. ; Sammons, D.W. (1984) Insulin-induced rapid 
15 decrease of a major protein in fat cell plasma membranes. J. Biol Chem. 259 : 12112- 
12116 

Shachar-Hill, Y.; Pfefifer, P.E.; Germann, M.W. (1996) Following plant 
metabolism in vivo and in extracts with heteronuclear two-dimensional nuclear 
magnetic resonance spectroscopy. Analytic. Biochem., 243: 1 10-118 
20 Singer, M.; Berg, P. (1992) Genes & Genomes. Ed. VIGOT, Paris 

Sparnins, VX. ; Dagley, S. (1975) Alternative routes of aromatic catabolism in 
Pseudomonas acidovorans and Pseudomonas putida : Gallic acid as a substrate and 
inhibitor of dioxygenases. J. Bacteriol. 124 : 1374-1381 

Stafford, HA; (1994) Anthocyahins and betalains : evolution of the mutually 
25 exclusive pathways. Plant Set ; 101:91-98 

Suemori, A.; Nakajima, K.; Kurane, R; Nakamura, Y. (1995) L-Phenylalahine 
and L-Tyrosine degradative pathways in Rhodococcw erythropolis. Report Nat. Inst 
Biosci. Hum. Tech. 3: 33-36 

- 

Suemori, A; Nakajima, K.; Kurane, R; Nakamura, Y. (1996) Purificatibn and 
30 characterization of o-hydroxyphenylacetate 5-hydroxylase, m-hydroxyphenylacetate 6- 
hydroxylase and p-hydroxyphenylacetate 1-hydroxylase from Rhodococcus 
erythropolis. Journal of Fermentation and Bioengineering, 81:133-137 

Swiatek, L.; Grabias, B.; Kalemba, D. (1998) Phenolic acids in certain medicinal 



BNSOOC1D: <WO, 



.02367B7A2_I_> 



WO 02/36787 72 PCT/FR01/03364 

plants of the genus Artemisia. Pharm. Pharmacol. Lett. 4: 158-160 

Swiatek, L. (1977) kwasy fenolowe I Glukozydy irydoidowe w niektoiych 
krajowych gatunkach leczniczych z rodzaju Plantago. Herba Polonica XXEQ (3): 201- 
209 

5 Takizawa, N.; Yokoyama, H.; Yanagihara, KL; Hatta, T.; Kiyohara, H. (1995) A 

locus of Pseudomonas pickettii DTP0602. had, that encodes 2,4,6-McMorophenol 4- 
dechlorinase with hydroxylase activity, and hydroxylation of various chlorophenols by 
the enzyme. J. Ferment. Bioeng. 80: 3 1 8-326 

Trieu-Cuot, P. ; Carlier, C. ; Poyart-Salmeron, C. ; Courvalin, P. (1991) An 
1 0 integrative vector exploiting the transposition properties of Tnl 545 for insertional 
mutagenesis and cloning of genes from Gram-positive bacteria. Gene 106: 21-27 

Tseng, T.C.; Tsai, T.H.; Lue, M.Y.; Lee, H.T. (1995) Identification of sucrose- 
regulated genes in cultured rice cells using mRNA differential display. Gene. 161: 179- 
1782 

15 Vertes, A.; Asai, Y.; Inui, M.; Kobayashi, M.; Kurusu, Y.; Yukawa, H., (1994) 

Transposon mutagenesis of Coryneform bacteria, Mol Gen. Genet, 245, 397-405 

Vierstra, R.D. (1993) Protein degradation in plants. Ann. Rev. Plant Physiol Plant 
Mol. Biol. 44 : 385-410 

Viviani, F.; Little, J.; Pallett, K.R (1998) Mode of action of Isoxaflutole - 2- 
20 Characterisation of the inhibition of the carrot 4-hydroxyphenylpyruvate dioxygenase 
by the diketonitrile derivative of isoxaflutole; Pestic. Biochem. Physiol. 62 : 125-134 

Whistance, GJL; Threlfall, D R. (1970) Biosynthesis of phytoquinones. 
Homogentisic acid: a precursor of plastoquinones, tocopherols and alpha- 
tocopherolquinone in higher plants, green algae and blue-green algae. Biochem. J. 117: 
25 593-600 

Xun, L.Y. (1996) Purification and characterization of chlorophenol 4- 
monooxygenase from Burkholderia cepacia AC1 100. J. Bacteriol 178; 2645-2649 

Xun, L. & Sandvik, E.R. (2000) Characterization of 4-hydroxyphenylacetate 3- 
hydroxylase (HpdB) of Escherichia coli as a reduced Flavin Adenine Dinucleotide- 
30 utilizing rnonooxygenase. Appl. Env. Microbiol. 66 : 481-486 



BNSDOCID: <WO 0236787A2 I > 



WO 02/36787 PCT/FRO 1/03364 

Revendications 

1. Precede pennettant de rendre ies plants toi&antes a un herbicide 
caracterise en ce que l'on exprime dans lesdites plantes au moins une enzyme 

5 pennettant le contournement de la voie metabolique inhibee par ledit herbicide. 

2. Proceed selon la revendication 1 , caracterise en ce que 1'herbicide est un 
inlnbiteur d'HPPD. 

3. Procede selon la revendication 2, caracterise en ce que l'on exprime dans 
la plante une HPP oxydase et/ou une HP AH et/ou une HPAC. 

1 0 4 - Polypeptide, caracterise en ce qu'il possede une activite HPP oxydase. 

5. Polypeptide selon la revendication 4, caracterise en ce qu'il est insensible 
aux inhibiteurs d'HPPD. 

6. Polypeptide selon l'une des revendications 4 ou 5, caracterise en ce qu'il 
comprend la sequence d'acides amines de la SEQ ID NO 2, ses fiagments et ses 

15 sequences homologues. 

7. Polypeptide selon la revendication 6, caracterise en ce qu'il comprend 
une sequence d'acides amines selectionnee parmi le groupe comprenant SEQ ID NO 4 
et SEQ ID NO 6, leurs fragments et leurs sequences homolognes 

8. Polypeptide, caracterise en ce qu'il possede une activite HPAH. 

20 9 * Polypeptide selon la revendication 8, caracterise en ce qu'U est insensible 

aux inhibiteurs d'HPPD. 

1 0. Polypeptide selon l'une des revendications 8 ou 9, caracterise en ce qu'il 
comprend la sequence d'acides amines de la SEQ ID NO 8, ses fragments et ses 
sequences homologues. 
25 Polypeptide, caracterise en ce qu'il possede une activite HPAC 

12. Polypeptide selon la revendication 11, caracteris£ en ce qu'il est 
insensible aux inhibiteurs d'HPPD. 

13. Polypeptide selon l'une des revendications 11 ou 12, caracterise en ce 
qu'il comprend la sequence d'acides amines de la SEQ ID NO 10, ses fiagments et ses 

30 



14. Polypeptide selon la revendication 13, caracterise en ce qu'il comprend 
une sequence d'acides amines selectionnee parmi le groupe comprenant SEQ ID NO 12 
et SEQ ID NO 14, leurs fiagments et leurs sequences homologues 
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15. Sequence d'acide nucleique caract&isee en ce qu'elle code pour un 
polypeptide selonl'une des revendications 4 k 14. • ~ " "** ' 

16. Sequence d'acide nucleique codant pour une HPP oxydase, caracteriste 
5 en ce qu'elle comprend une sequence d'acide nucteique selectionnee parmi le groupe 

comprenant les sequences codantes des SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5 ou 
SEQ ID NO 15, leurs sequences homologues, leurs fragments et les sequences capables 
de s*hybrider de maniere selective aux dites SEQ ID NO 1, 3, 5 ou 15. 

17. Sequence d'acide nucleique codant pour une HPAH, caracterisee en ce 
10 qu'elle comprend une sequence d'acide nucleique selectionn6e panni le groupe 

comprenant les sequences codantes des SEQ ID NO 7 ou SEQ ID NO 17, leurs 
sequences homologues, leurs fragments et les sequences capables de s'hybrider de 
maniere selective aux dites SEQ ID NO 7 ou 17. 

18. Sequence d'acide nucleique codant pour une HPAC, caracteris<§e en ce 
15 qu'elle comprend une sequence d'acide nucleique selectionnee parmi le groupe 

comprenant les sequences codantes des SEQ ID NO 9, SEQ ID NO 1 1, SEQ ID NO 13 
ou SEQ ID NO 19, leurs sequences homologues, leurs fragments et les sequences 
capables de s'hybrider de maniere selective aux dites SEQ ID NO 9, 1 1, 13 ou 19. 

19. Cassette d'expression comprenant une sequence codante, caracterisee en 
20 ce que la sequence codante comprend une sequence d'acide nucleique selon l'une des 

revendications 15 a 18. 

20. Vecteur de clonage et/ou d'expression, caracterise en ce qu'il comprend 
au moins une cassette d'expression selon la revendication 19. 

21. Cellule vegdtale transformee, caracterisee en ce qu'elle comprend au 
25 moins une cassette d'expression selon la revendication 19. 

22. Plante transformee, caracterisee en ce qu'elle comprend au moins une 
cassette d'expression selon la revendication 1 9. 

23. Graines de plantes transformees selon la revendication 22, caracterisees 
en ce qu'elles comprennent au moins une cassette d'expression selon la revendication 

30 19. 

24. Precede de transformation des plantes, caracteris<§ en ce que 1'on intorduit 
dans leur genome au moins une cassette d'expression selon la revendication 19. 



BNSDOCID: <WO 0236787A2_L> 



WO 02/36787 



75 



PCT/FR01/03364 



10 



25. Procededed&herbagesdleetifde plantes, notamment de cultures, ^ l'aide 
d«un inhibiteur de 1HPPD, caracterise en ce qu'on applique cet herbicide sur des plantes 
transformees selon la revendication 22. 

26. Procede de contrdle des mauvaises herbes dans une surface d'un champ 
comprenant des graines selon la revendication 23 ou des plantes transformees selon la 
revendication 22, caracterise en ce qu'il comprend l'apphcation dans la dite surface du 
champ d'une dose toxique pour les dites mauvaises herbes d'un herbicide inhibiteur 
d'HPPD, sans toutefois affecter de maniere substantieUe les graines ou plantes 
transformee selon rinvention. 

27. Precede de culture des plantes transformees selon la revendication 22, 
caracterise en ce qu'il comprend le semis des graines selon la revendication 23 dans une 
surface d'un champ approprie pour la culture des dites plantes, l'application sur la dite 
surface du dit champ une dose toxique pour les mauvaises herbes d'un herbicide ayant 
pour cible 1'HPPD en cas de presence de mauvaises herbes, sans affecter de maniere 
substantielle les dites graines ou les dites plantes transformees, puis la recolte des 
plantes cultivees lorsqu'elles arrivent a la maturity souhaitee et dventueUement la 
separation des graines des plantes recoltees. 

20 28. Precede selon l'une des revendications 25 a 27, caracterise en ce que 

l'heriiicide est apphque en pre-sernis el/ou en post-levee. 



15 



25 



30 
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Sequence codant lepeptideN-tenninal 




Sequence codant le peptide N°6 



D 



Hin dHt (2660) 



M< II (5054; 



Sacl (2955) 



Figure 3 



Sacl 

2901 TTTGGAAATC GACGGGATCC AGCGGACCAG CACTGCCATC TCCGTCGTGG 
AAACCTTTAG CTGCCCTAGG TCGCCTGGTC GTGACGGTAG AGGCAGCACC 

Sacl 



2951 AGCTCATGCC GCCCCGCTAT GACGGCCTGC TGGCCCGGCT GTCCCAGCAG 
TCGAGTACGG CGGGGCGATA CTGCCGGACG ACCGGGCCGA CAGGGTCGTC 

3001 GAGAGCCGCC ATCCCAGCTA GGGCATAGGT GATCCGCACC ACCTTTGAGC 
CTCTCGGCGG TAGGGTCGAT CCCGTATCCA CTAGGCGTGG TGGAAACTCG 

3051 ATATTTGCAG TAGCTACTGT GATAAACTGC ( Mfc c AGCTCATGTC 
TATAAACGTC ATCGATGACA CTATTTGACG GTTTTTATGG TCGAGTACAG 

+ 2 j 

3101 TGTTCACTTG CCAATCGCTG ATCCAGATCC GACGATTCCT GCATGACTTC 
ACAAGTGAAC GGTTAGCGAC TAGGTCTAGG CTGCTAAGGA CGTACTGAAG 



+2 



3151 ACTTACAGTG TCCGGCCGGG TGGCGCAGGT CCTCAGCAGC TATGTCAGCG 
TGAATGTCAC AGGCCGGCCC ACCGCGTCCA GGAGTCGTCG ATACAGTCGC 



+2 > 

4801 



GGCGAAGGAG GCGGTGGCGG GCTAGGGCCG GCCTCGTCGA AATGCCGCCC 
CCGCTTCCTC CGCCACCGCC CGATCCCGGC CGGAGCAGCT TTACGGCGGG 

4851 TCCAACCCAA CTCAGTACCA GCTCAGGGCG TTCTCAGGGC TGGGAACGCC 
AGGTTGGGTT GAGTCATGGT CGAGTCCCGC AAGAGTCCCG ACCCTTGCGG 
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A HP AH 
hydroxylase - Q53657 
mo no oxygenase - Q9ZAM4 
putativ oxygenase .-" Q54171 
MHPA_EC0KE 
Oxygenase - 086481 
Consensus 



|> HP AH 

hydroxylase - Q53657 
mono oxygenase - Q9ZAM4 
putativ oxygenase - Q54171 
MHPAECOLI 
- Oxygenase - 086481 
Consensus 



HPAH 

hydroxylase - Q53657 
monooxygenase - Q9ZAM4 
putativ oxygenase - Q54171 
MHPA_ECOLI 
Oxygenase - 08 6481 
Consensus 



D HPAH 
hydroxylase - Q53657 
monooxygenase - Q9ZAM4 
putativ oxygenase - Q54171 
MHPAJSOXLI 
Oxygenase - 086481 
Consensus 



(19) QSIHIPYERHADQDAGADTPARH 

(1) 

(51) SRPIRFRIMSICERIGMLPCS 

(1) MD — AS — 

(1) MAIQHPDIQPAVNHSVQ 

(1) MAD-PTR- 

(51) 




201 

(152) ALQI»PI»IDLRWHSK 

(107) ARELG-VRIVRGSG 

(201) AEASELASVNYG 

(107) ARELG-ADIRRG 

(127) VSRFPNVRCLF 

(117) VARLG-VD 
(201) 

351 

(288) LLGKDAP FELEW AS VYTFACLRMDRFVH 

(230) SDHGMHD — VTWLSRLTDVSRLADS 

(348) GMALDIEI-IDMGTWVAGHALYVEQMVSi 

(244) IDISHAEH — EWVSAFGDATRLVTEYRR< 

(262) PNPDNVEL — IRQRVYTHNARIAQRFRI 

(253) VRQVRTP TWTSVFTFQQRMVPRMGE* 



rAIiE PQAEGALLTVET- P DGS YR~ I DAQJ 
rGFAQDADGVTVETDT-G I*LRAR 

edfeqgadgvsatveeaatgkqqkirae: 

DHGDHVEAEVRG-PEDEKIRLTAPYj 
SQQDDEVTI/HLKT-AEGQREIVKAQ 1 
SFSQDAEGVDVTLEH-ADGTTBSTRVPW! 




(351) 

401 

(338) SGVi 

(278) 1^3; 

(397) TAVE] 

(292) TGI ' 

(310) S< 

(300) TGV< 

(401) DXXXLXWKL 




GKVXXAGDAXB 




450 

YAADENI RNSTR 

IADGW RNTRT 

KLAKRNTGYARGIADS 

VGERLM MNTKA 

DHAKAMI DLSVT 

'IGERLL GSTKK 
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LISTE DE SEQUENCES 
<110> Aventis CropScience S.A. 

<120> Plantes toldrantes aux herbicides par contoumement de~ 
voie metabolzque 

<130> genes du shunt 

<140> 
<141> 

<160> 22 

<17D> Patentln Ver. 2.1 

<210> 1 
<211> 1683 
<212> ADN 

<213> Arthrobacter globiformis 

<220> 

<221> CDS 

<222> (1) . . (1683) 

<400> 1 

tCa Ctt aca gtg tcc g gc egg gtg gcg cag gtc etc aac aac 4ft 

Met Thr Ser Leu Thr Val Ser Gly Arg Val All Gin Si Leu SS Ser 

1 5 10 15 

tat gtc age gat gtg ttc ggt gtg atg ggc aac gga aac etc tac ttc Qfi 
Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Pne 
20 25 30 

?l g l a ° 11° gag aag gag ggc etc cgc.ttc acg gcc gta cgc cat 14 4 

Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val A?g His 
35 40 45 

III It 111-1,1 ^ If? ??? ?»? ?f C ^ C ?W 9ca tcc ggg 192 



240 



Glu Gly Ala Ala He Ala lia Ala Asp aH £r Tyr Axg E Ser g? 
ou 55 60 

cgc ctg gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac arc 
Arg Leu Ala Ala Gly Thr Thr Thr Tyr I?y Pro Gly Jyr ?hr A*n E 

70 75 80 

2u Th? f?° f tC ??° 9 ? g 9 f g gtc Cag gcg ca 9 atc ccc 9*9 gtg etc 288 
Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu 
85 90 95 

a £° %f g gac gcc ccg agc a g° gg° g cc °gg cct t gg gac gta aa c 336 

Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arf Pro Tr? Isp Val So 
100 !05 220 

r?^ g f° 9 f° ggg ctg ggg geg g°g ac ^ ttc acg gtc acc 384 

Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val ?hr 

• Lii> 120 225 

cgt gaa gcc gca ggc tcc atc acg cag gaa gcg gtg gag tac aca r>i-f- a-*9 
Arg Glu Ala Ala Gly Ser lie Thr Gin llu All Va! SS- £yr E Leu " 2 



E S 5 S S jK «3 lie E Vai II Tyr I £ Leu £? E "° 

160 

2J ffi SI IS III SS SS £ S «2 K »S5 K IS & 528 
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16.5 170 175 

ccg gac gcc ate ggc ggc gga etc gga egg gcg gee gaa gtg egg gcg 576 
Pro Asp Ala lie Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg. Ala 
180 185 190 

gcc gaa ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gcc ggc cgc 624 
Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu lie Leu Ala Gly Arg 
195 200 205 

ggt gcg cac etc gca gga gcc ggc ccc gaa etc egg gaa etc gcc gac 672 
Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp 
210 215 220 

cgc . etc ggc gcg etc acg gcc ggc ace gca ctg gcg ctg aac ctg ctg 720 
Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu 
225 230 235 240 

cag ggc gag ggg tac etc ggc gtc gcg gge ggc ttc ggc acg gat ace 768 
Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr 
245 250 255 

gcc gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gcc 816 
Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala 
260 265 270 

age ctg ace ccc ttc ace atg cgc ttc ggc cac ctg ate ggc ccg gac 864 
Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu lie Gly Pro Asp 
275 280 285 

gcc ace gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg egg 912 
Ala Thr Val lie Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg 
290 295 300 

gtg gac ctg ttt gtc agt gcg gac gcg aag gcc get gcc ggc egg ate 960 
Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg lie 
305 310 315 320 

etc egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc tgg 1008 
Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
325 330 335 

cgc gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc 1056 
Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
340 345 350 

ggc acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get 1104 
Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
355 360 365 

teg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac 1152 
Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
370 375 380 



ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc cgt 
Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Ara 
385 390 395 ~ 



400 



1200 



cct cag gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg ctt 1248 
Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser lie. Gly Leu 
405 410 415 

ggc ctg gcc age gcc gtg ggg gcg tec egg gcc gtg gac gac ggc aat 1296 
Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Glv Asn 
420 425 430 

ate ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tec 1344 
He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
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435 440 



445 



gac ctg gaa teg etc gtg ggc gcg gcg age age gee gtc gtg gtg ate 1392 
Asp Leu .Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val vil SS 
4bU 455 460 



S£ ao« ? ?f° ta ° ggg 9cc gag ate cat; cag tac ggc tea egg 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 

4b5 470 475 480 



age gaa tgg atg agg gee teg caa gcg gcg aag gag gcg gta oca aae 

Ser Glu Trp Met Arg Ala Ser Gin Ala 111 Lyl Glu J2 Val If a Gly 

545 550 555 560 
tag 



<210> 2 
<211> 561 
<212> 

<213> Arthrobacter globiformis 
<400> 2 

Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser 
1 5 10 15 

Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe 
20 25 30 

Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His 
35 40. 45 

Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly 
DU 55 60 

Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala 
5 70 75 80 

Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin lie Pro Val Val Leu 
85 90 95 

Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp 
100 105 no 

Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr 
X1:> 120 125 

Arg Glu Ala Ala Gly Ser lie Thr Gin Glu Ala Val Glu Tyr Ala Leu 



Ala Arg Arg Thr Ala Val Val 



1440 



ggg etc ace gaa aag ccc atg ctg ate ccc gaa gtg gac ttc acre aao 14RR 
Gly Leu Thr Glu Lys Pro Met Leu lie Pro Ilu Val Ep p£e lei Gly 88 
4Q 5 490 495 

??o £ g ° ?? 9 £r c 9gg gcg gaa tcc 9 ca ate ate cgc aag ctg teg 1536 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Itr 
5 °0 505 510 



ga ? 5* c * cc ?cg etc acg gac tgg ate gag gee ggc gee agg gga ace 1584 
Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala A?J Gly Ihr " 
i>l^> 520 525 

Phf P C ~ 9 ° C9 ° at ° acc tca a ^ c ^ tc C <3Q.<3CC ccg tgg ctg 1632 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Tr| Leu 
=> JU 535 540 



1680 



1683 



He Ala Val Pro Tyr Asp Leu Ser Ala 
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145 150 155 160 

Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val 
165 170 175 

Pro Asp Ala lie Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala 
180 185 190 

Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu lie Leu Ala Gly Arg 
195 200 205 

Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp 
210 215 220 

Arg.Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu 
225 230 235 240 

Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr 
245 250 255 

Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala 
260 265 270 

Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu lie Gly Pro Asp 
275 280 285 

Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg 
290 295 300 

Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He 
305 310 315 320 

Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
325 330 335 

Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
340 345 350 

Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
355 360 365 

Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
370 375 380 

Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg 
385 390 395 400 

Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu 
405 410 415 

Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn 
420 425 430 

He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
435 440 445 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
450 455 4 60 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 
465 470 475 " 480 

Gly Leu Thr Glu Lys Pro Met Leu lie Pro Glu Val Asp Phe Ser Gly 
485 490 495 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 
500 505 510 
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Asp Leu Ser Ala Leu Thr Asp Trp lie Glu Ala Gly Ala Arg Gly Thr 
515 520 525 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp^eu 
530 535 540 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala 
Gly 



545 550 555 560 



<210> 3 
<211> 1944 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<220> 

<221> CDS 

<222> (55) . . (1737) 

<400> 3 

ccgacgtcgc atgctcccgg ccgccatggc ggccgcggga attcgattga attc atg 57 



Met 
1 



tt i « — * * yyL " "9 99° a ^c gga aac ate tac ttc a+ct 

Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Pnl Leu 



105 



5 tt a 5; a gt? tcc egg gtg gcg cag gtc etc age age tat 

Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser sir Tyr 
5 10 15 

vai s^ S? 22 2E E? £2 ggc . aac gga aac tac ttc ctg i 53 

30 



gac gee gee gag aag gag ggc etc cgc ttc acg gec gta cqc cat aaa 201 
Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Sg h2s Glu 
■» 40 45 

2?* ??° «f C « c gcg gcg gcg gac occ tac tat egg gca tcc ago cue 24 9 

50 16 Ma ^ Ala Tyr ' T ^ r ^ ^ a sir If? Arg 

55 60 55 

ctg gcg gcg ggg acc acc acc tac ggc ccc gat tac acc aar n^n rH-« r>an 
Leu Ala Ala Gly Thr Thr Thr Tyr !!y Pro gy Tyr Thr Hn IS £u 2 " 
70 75 80 

f tC g ?° gag gCg gtc caa aca caa atc cc c gtg gtg etc qtc 345 
Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Lei Va! 

90 95 

acc ggg gac gec ccg age age ggc gee egg cct tgg gac gtq qac caa 3<« 
Thr Gly Asp Ala Pro Ser Ser Gly Ala Ar| Pro TrJ L P Val Sp III " 
1O0 105 110 

gee gcg atc gec gee ggg ctg ggg gcg gcg acc ttc acg gtc acc cat 441 
Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Th? Val Thr Arq 
J- 15 120 125 

K K K 85 JS S 32 S S SI S3 SS S? S £ ffi " 9 

135 140 145 

egg egg acc gec gtc gtg atc gec gtt cca tac gac ctg tcq qcc dti- 
Arg Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Lei Itr All 2u 
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gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc teg gtt ccg 585 
Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val fro 
165 170 175 

gac gcc ate ggc ggc gga etc gga egg gcg gcc gaa gtg egg gcg gcc 633 
Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala 
180 185 190 

gaa ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gcc ggc cgc ggt 681 
Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg Gly 
195 200 205 

gcg. cac etc gca gga ace ggc ccc gaa etc egg gaa etc gcc gac cgc 729 
Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg 
210 215 220 225 

etc ggc gcg etc acg gcc ggc ace gca ctg gcg ctg aac ctg ctg cag 777 
Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin 
230 235 240 

ggc gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat ace gcc 825 
Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly % Thr Asp Thr Ala 
245 250 255 

gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gcc age 873 
Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser 
260 265 270 

ctg acc ccc ttc ace atg cgc ttc ggc cac ctg ate ggc ccg gac gcc 921 
Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu lie Gly Pro Asp Ala 
275 280 285 

acc gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg egg gtg 969 
Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val 
290 295 300 305 

gac ctg ttt gtc agt gcg gac gcg aag gcc get gcc ggc egg ate etc 1017 
Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu 
310 315 320 

egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc tgg cgc 1065 
Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg 
325 330 335 

gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc ggc 1113 
Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly 
340 345 350 

acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get teg 1161 
Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser 
355 360 365 

gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc 1209 
Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp Gly 
370 375 380 385 

ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc cgt cct 1257 
Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg Pro 
390 395 400 

cag gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg ctt ggc 1305 
Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu Glv 
405 410 415 

ctg gcc age gcc gtg ggg gcg tec egg gcc gtg gac gac ggc aat ate 1353 
Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn He 
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420 . - 425 430 



t!; 9 5*? f tg g ? g gcg ggc gac 99c gga tto etg atg gg C ctg €cc aac 14 01 
Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu lerjtep 
" D 440 445 ~ 

a IS 12 21 SI IS £1 IS IS IS IS si si SI IS £ 

455 460 455 

ttZ i a ° 9 f° ?f c tac 999 gag ate cat cag tab ggc tea cqa aao 14 97 

Asn Asp Ala Ala Tyr Gly Ala Glu lie His Gin Tyr lly ier Sg If J " 9? 

475 4 8 o 

21 IS K SI IS St 21 IS SI IS SI IS IS IS II? Si 

485 490 495 

IS S K IS II? SI IS IS IS IS IS SI si a SI-IS i593 

ouu 505 510 

21 IS IS IS IS IS IS IS IS IS IS SI S' IS IS IS 1641 

0X0 520 525 

SI SI Sp IS IS |S IS IS IS SI SI SI SI IS 21 IS 1689 

5 540 545 

IS IS SI SI IS III s IS SI SI IS SI SI III 85 *- 1737 

550 555 56 5 

ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc 1797 
agggctggga acgccctgag ctgctactca tttgttcgaa ctcgagaatt caatcactag 1857 
tgaattcgcg gccgcctgca ggtcgaccat atgggagagc tcccaacgcg ttggatgcat 1917 
agcttgagta ttctatagtg tcaccta 

1944 

<210> 4 
<211> 561 
<212> 

<213> Sequence artificielle 
<400> 4 

Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser 
5 10 15 

Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe 

25 30 

Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His 

40 45 

Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly 

55 60 " 

Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala 

75 80 
Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu 
85 90 95 
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Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp 
100 105 HO 

Gin Ala Ala lie Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr 
115 120 125 

Arg Glu Ala Ala Gly Ser lie Thr Gin Glu Ala Val Glu Tyr Ala Leu 
130 135 140 

Ala Arg Arg Thr Ala Val Val lie Ala Val Pro Tyr Asp Leu Ser Ala 
I 45 150 155 ~ 160 

Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val 
165 170 175 

Pro Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala 
180 185 190 

Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly "Arg 
195 200 205 

Gly Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala Asp 
210 215 220* 

Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu 
225 230 235 240 

Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr 
245 250 255 

Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala 
260 265 270 

Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp 
275 280 "* 285 

Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arq 
290 295 300 

Val Asp Leu Phe Val Ser Ala Asp Ala . Lys Ala Ala Ala Gly Arq He 
305 310 315 320 

Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
325 330 335 

Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
340 345 350 

Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
355 360 365 

Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
370 375 380 

Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arq 
385 390 395 ~ 400 

Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu 
405 410 415 

Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Glv Asn 
420 425 430 

He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
435 440 445 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
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450 455 4 6 o 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu lie His Gin Tyr Gly Ser Arg 
465 4 70 475 _ _ -_480 

Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly 
485 490 495 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 
500 505 510 

Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
515 520 525 

Phe. Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
" u 535 540 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
45 550 555 5 6 o 



<210> 5 - 
<211> 1962 
<212> ADN 

<213> Sequence artiflcielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<220> 
<221> CDS 

<222> (HI) . . (1793) 
<400> 5 

aggtgacact atagaatact caagctatgc atccaacgcg ttgggagctc tcccatatgg 60 
tcgacctgca ggcggccgcg aattcactag tgattggaag gatccggtgc atg act 116 



Met Thr 
1 



tea ctt aca gtg tec ggc egg gtg gcg cag gtc etc age age tat gtc 
Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser sir Tyr Val 
5 10 15 " 



164 



212 



age gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc eta aac 
Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Sp 

gee gec gag aag gag ggc etc cgc ttc acg gec gta cgc cat aaa aci- ?fiO 
Ala Ala Glu Lys Glu Gly Leu Arg Phe ThI Ala Val Hg His Ifu Gly 

0 45 50 

gec gec ate gcg gcg gcg gac gee tac tat egg gca tec ggg C gc eta 308 
Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr A?g Xla Ser lly Sg 2u 



gcg gcg gigg acc acc acc tac aac ccc a at tar *r>r» *- 
Ala Ala Gly Thr Thr Thr Tyr gj Pro l!y ^ Ihr Asn IX ffij ?g 
/0 75 80 



356 



K 2S S SS IS 85 f£l s ?S K J3-S3 SS ?5 ffi 4M 

05 90 95 

ggg gac gec ccg age age ggc gec egg cct tgg gac gtg gac cag gec 452 
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Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gin Ala 
100 105 110 

gcg ate gec ggc ggg ctg ggg gcg gcg acc ttc acg gtc acc cgt ^aa 500 
Ala lie Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg" Glu 
115 120 125 130 

gec gca ggc tec ate acg cag gaa gcg gtg gag tac gca ctt gee egg 548 
Ala Ala Gly Ser lie Thr Gin Glu Ala Val Glu Tyr Ala Leu Ala Arg 
135 140 145 

egg acc gec gtc gtg ate gec gtt cca tac gac ctg teg gec ctt gag 596 
Arg Thr Ala Val Val lie Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu 
150 155 160 

gcg gca gag gaa gat ctt ccc gtg ccg ccg gcg gee teg gtt ccg gac 644 
Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp 
165 170 175 

gec ate ggc ggc gga etc gga egg gcg gec gaa gtg egg gcg gee gaa 692 
Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu 
180 185 190 

ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gee' ggc cgc ggt gcg 740 
Leu Leu Ala Gly Ala Lys Arg Pro Leu lie Leu Ala Gly Arg Gly Ala 
195 « 200 205 210 

cac etc gca gga gec ggc ccc gaa etc egg gaa etc gec gac cgc etc 788 
His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu 
215 220 225 

ggc gcg etc acg gec ggc acc gca ctg gcg ctg aac ctg ctg cag ggc 836 
Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin Gly 
230 235 240 

gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat acc gec gee 884 
Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala 
245 250 255 

ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gee age ctg 932 
Gly Leu Met Gly Glu Ala Asp Val . Val Leu Val Ala Gly Ala Ser Leu 
260 265 270 

acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg gac gee acc 980 
Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp Ala Thr 
275 280 285 290 



gtg ate cag ate gac acc gec atg gag ccg acg gac ccg egg gtg gac 
Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp 



295 300 305 



1028 



ctg ttt gtc agt gcg gac gcg aag gee get gee ggc egg ate etc egg 1076 
Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu Arg 
310 315 320 

ctg ctg gat gac gec gee ggg gec aat gcg teg aag gec tgg cgc gcg 1124 
Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala 
325 330 335 

gaa gca etc aag cgt ctg gec gaa gga ccc tgc cac cac ccc gigc acc 1172 
Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr 
340 345 350 

gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get teg gca 1220 
Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala 
355 360 365 370 

ctg gat gee gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc ggg 1268 



BNSDOCID: <WO. 



_0236787A2J_> 



WO 02/36787 „ PCT/FR01/03364 

Leu Asp Ala Val L§u Pro Glu Arg Arg Thr Val Val Glri Asp Gly Gly 
375 380 385 

ok° f 9 - 2? C tgg gCa COC atg tac cgc atc ccc cgt cct -cag 1316 

His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg lie Pro Arg Pro" Gin 

390 395 400 

gac ctg gtc atg gtg ggg acc gcg tac cag teg atc ggg ctt ggc ctg 1364 
Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser lie Gly Leu Gly Leu 
405 410 415 

iUa Hr IS III til IV c CC »" 9 ? C 51:9 ga ° 9aC atc ctg 1412 

y Ala Ser Ala Val As P As P G1 y Asn He Leu 

^ u 425 430 

gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tec gac ctg 14 60 
Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu 
435 440 445 * 450 

Glu III ft? £? f? 9 9 ? 9 agC agC gCC gtc gtg atc tac'aac 1508 

Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He Tyr Asn 
455 460 465 

gat gcc gcc tac ggg gec gag atc cat cag tac ggc tea egg ggg etc 1556 
Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg Gly Leu 
470 475 48o 

acc gaa aag ccc atg ctg atc ccc gaa gtg gac ttc age ggg att gee 1604 
Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe sir Gly lit IX 
4 85 490 4 -g 5 

a™ 9 ? 9 ?? g ?? g 9aa tcc gca atc atc C 3 C aa 9 ctg teg gac etc 1652 

Arg Ala He Gly Ala Glu Ser Ala He He Arg LyI Leu Ser Asp Leu 
DUU 505 510 

ttt a°! ^ ?k 9 ? aC £ 99 a ^° gag gcc ggc gcc agg 99 a acc ttc gtg 1700 
Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr Phe Val 

515 520 525 " 530 

gcc gac tgc cgc atc acc tea age gtc egg gcc ccg tgg ctg aac aaa 1748 
Ala Asp Cys Arg He Thr Ser Ser- Val Arg Ala Pro Jr? Leu Sr SS 
535 540 545 

£ 99 w t9 399 9 f c tcg caa gcg gcg aa 9 gag' gcg gtg gcg ggc tag 1793 
Trp Met Arg Ala Ser Gin Ala Ala Lys Glu All Val fla Gly " 

550 555 560 

ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc 1853 
agggctggga acgccctgag ctgctactca gtttgttcga actcgagaat tcaatcgaat 1913 
tcccgcggcc gecatggegg cegggagcat gegaegtegg gcccattcg 1962 

<210> 6 
<211> 541 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<400> 6 

Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Asp Ala Ala 

10 15 
Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu Gly A! a Ua 
20 25 30 
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lie Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg Leu Ala Ala 
35 40 45 

Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu Thr Ala Leu 

50 55 60 " ~~ ' 

Ala Glu Ala Val Gin Ala Gin lie Pro Val Val Leu Val Thr Gly Asp 
65 ,70 75 80 

Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gin Ala Ala lie 
85 90 95 

Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg Glu Ala Ala 
100 105 HO 

Gly Ser lie Thr Gin Glu Ala Val Glu Tyr Ala Leu Ala Arg Arg Thr 
115 120 125 

Ala Val Val lie Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu Ala Ala 
130 135 140 

Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp Ala lie 
1*5 150 155 160 

Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu Leu Leu 
165 170 175 

Ala Gly Ala Lys Arg Pro Leu lie Leu Ala Gly Arg Gly Ala His Leu 
180 185 190 

Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu Gly Ala 
195 200 205 

Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin Gly Glu Gly 
210 215 220 

Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala Gly Leu 
225 230 235 240 

Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser Leu Thr Pro 
245 =250 255 

Phe Thr Met Arg Phe Gly His Leu lie Gly Pro Asp Ala Thr Val lie 
260 265 270 

Gin lie Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp Leu Phe 
275 280 285 

Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu Arg Leu Leu 
290 295 300 

Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala Glu Ala 
305 310 315 320 

Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr Ala Glu 
325 330 335 

Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala Leu Asp 
340 345 350 

Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp Gly Gly His Phe 
355 360 365 

Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg Pro Gin Asp Leu 
370 375 380 

Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu Gly Leu Ala Sei- 
385 390 395 400 
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Ala Val Gly ATa^er Arg Ala Val Asp Asp Gly Asn lie Leu Val Leu 

405 410 415 

Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu Glu"~Ser 

Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He Tyr Asn Asp Ala 
435 440 445 

Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg Gly Leu Thr Glu 



4 60 



Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly He Ala Arg Ala 



475 4 8 o 



He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser Asp Leu Ser Ala 



490 495 
Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr Phe Val Ala Asp 

Cys Arg lie Thr Ser Ser Val Arg Ala Pro Trp Leu Ser Glu Trp Met 
0XS 520 - 525 

Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
530 535 546 

<210> 7 
<211> 1692 
<212> ADN 

<213> Pseudomonas acidovorans 

<220> 

<221> CDS 

<222> (1).. (1692) 

<400> 7 



S IS S SI E SI IS 3- 1" K 22 S| I?? SI 15 a » 

. 10 15 

a £ a £ ss a a a as; k is si a s - 

25 30 

K SK & SI S-S £ Sj K SI ?S ■ ?S SI Si IS SI 14< 

85 Iff K? 15 S 12 S SI a S| 2! E2 S| 15 IS 192 

a a a a s si si si a si a a a 15 is si 240 

75 80 

si si a £ if? 51 si s a is si is si si a is 288 

«S SI IS SI SI S! SI a 15 vS! IS is si 21 15 51 336 



105 110 
gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg ctg ccc 



gag 384 



<wo_ 
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Val Phe Phe Lys -Asp Gin Pro Leu Tyr Arg Phe Asp Leu Leu Pro Glu 
115 120 125 

gac ggc cac gag cgc ccg gcc ttc ate aac ctg cag cag tac tac gcc 432 
Asp Gly His Glu Arg Pro Ala Phe lie Asn Leu Gin Gin Tyr Tyr Ala 
130 t 135 140 

gag gee tat ctg gtc gag cgc gca ctg cag ctg ccg ctg ate gac ctg 480 
Glu Ala Tyr Leu Val Glu Arg Ala Leu Gin Leu Pro Leu lie Asp Leu 
145 150 155 160 

cgc tgg cac age aag gtc acg gca ctg gag ccg cag gcc gag ggc gcg 528 
Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gin Ala Glu Gly Ala 
165 170 175 

ctg ctg acc gtg gag acg cct gac ggc age tac cgc ate gat gcg caa 576 
Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg lie Asp Ala Gin 
180 185 190 

tgg gtc ctg gcc tgc gat ggc teg cgc teg ccg ctg cgc ggc ctg ctg 624 
Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly Leu Leu 
195 200 205 

ggc cag gaa age cat ggc cgc ate ttc cgc gac cgc ttc ctg ate gcc 672 
Gly Gin Glu Ser His Gly Arg lie Phe Arg Asp Arg Phe Leu lie Ala 
210 215 220 

gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc tgg ttc 720 
Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe Trp Phe 
225 230 235 " 240 

gac ccg ccc ttc cac ccg ggc cag age gtg ctg ctg cac cgc cag ccc 768 
Asp Pro Pro Phe His Pro Gly Gin Ser Val Leu Leu His Arg Gin Pro 
245 250 255 

gac gat gtc tgg cgc ate gac ttc cag ctg ggc tgg gac gcg gac ccc 816 
Asp Asp Val Trp Arg lie Asp Phe Gin Leu Gly Trp Asp Ala Asp Pro 
260 265 * 270 

gag gaa gag aaa aag ccc gag aac ate gtg ccg cgc ate cgc gcc ctg 864 
Glu Glu Glu Lys Lys Pro Glu Asn lie Val Pro Arg lie Arg Ala Leu 
275 280 285 

ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc age gtc tac acc 912 
Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val Tyr Thr 
290 295 300 

ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg gtc ttt 960 
Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val Val Phe 
305 310 315 320 

gcg ggc gac age gcc cac ggc gtc teg ccg ttt ggc gca cgc ggc gcc 1008 
Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg Gly Ala 
325 330 ^ 335 



aac age ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg gac cgc 
Asn Ser Gly Val Gin Asp Ala Glu Asn Leu Ala Trp Lys Leu Asn Arc 
340 345 350 



1056 



gtg ctg cgc ggc cag gcc gat gcc teg ctg ate gcc acc tac gg C gcc 1104 

Val Leu Arg Gly Gin Ala Asp Ala Ser Leu lie Ala Thr Tyr Glv Ala 

355 360 365 

gag cgc gaa tac gcg gcc gac gag aac ate cgc aac tec acg cgc gcc 1152 

Glu Arg Glu Tyr Ala Ala Asp Glu Asn lie Arg Asn Ser Thr Arg Ala 

370 375 380 

acc gac ttc ate acg ccc aag age gag ate age cgc ctg ttt cgc gac 1200 
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Thr Asp Phe ljejhr Pro Lys Ser Glu lie Ser Arg Leu Phe Arg Asp 

390 395 400 

gcc gtg ctg gac ctg gcg cgc gac cat gaa ttc gcg cgc egc .atc-otc 124 8 
Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe III Arg A?S fJSlSl 
405 410 415 

k ts as ass s sr s s s 22 sc 15 s a 2s 1296 

425 43 0 

■S S £ K S K'S £ JS Gi* .32 3S-Z2 S 85 S 

4J:> 440 445 

S? fS' 1? C f^* ?? 9 CC ° atg °Be-W <=cc ggc gca gac ggc acg gcc 1392 
Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp fly ?h? Ha 

455 460 

t C » 9 f tg * g ° g f a Ctg 99a ccg gac ttc acg ctg ctg cac ttc" gac 1440 
Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Th? Leu Leu flX lit J£p 

470 47 ^ 480 

Pro ?S Pro A?a ??f r? 9 9 ? 9 f*" «* ^ c 9*9 <*c aac ctg tec 1488 

° Thr Pro Ala TfP Ala G: >- n Ala Leu Pro Gly Val Leu Asn Leu Ser 
485 490 495 

III m.1 K If 15 £2 K S IS S X P IS S £ ?2 S£ 1536 

500 505 510 

Ala 2S Glv 2u a? 9 f?° ^° ° tg gat gca c * c ccc ^ c acc age 1584 

Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser 

OAO 520 525 

& S 2S s £ si a S SS ss 2; S5 s 1632 

535 540 

IJ SS S S «3 S ESfiSJ! E & S5 E E 1680 

555 560 

gcc acg gcc tga 

Ala Thr Ala 1692 



<210> 8 
<211> 564 
<212> 

<213> Pseudomonas acidovorans 
<400> 8 

Met Ser His Pro Ala He Ser Leu Gin Ala Leu Arg Gly Ser Gly Ala 

10 15 
Asp He Gin Ser He His He Pro Tyr Glu Arg His Ala Asp Gin Asp 

Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val He Val Gly Ala 

40 45 



Gly Pro Val Gly Leu Ser Leu Ala He Asp Leu Ala Gin Arg Gly 



60 



Gin 



Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly Ser £rg 

75 "80 
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Ala lie Cys Phe Ser Lys Arg Thr Leu Glu He Trp Asp Arg Leu Gly 
85 90 95 

Val Gly Gin Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu Gly, Lys 
100 105 110 ~ """*... 

Val Phe Phe Lys Asp Gin Pro Leu Tyr Arg Phe Asp Leu Leu Pro Glu 
115 120 125 

Asp Gly His Glu Arg Pro Ala Phe He Asn Leu Gin Gin Tyr Tyr Ala 
130 135 . 140 

Glu Ala Tyr Leu Val Glu Arg Ala Leu Gin Leu Pro Leu lie Asp Leu 
145 150 155 160 

Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gin Ala Glu Gly Ala 
165 170 175 

Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg He Asp Ala Gin 
180 185 190 

Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly Leu Leu 
195 200 205 

Gly Gin Glu Ser His Gly Arg lie Phe Arg Asp Arg Phe Leu lie Ala 
210 215 220 

Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe Trp Phe 
225 230 235 " 240 

Asp Pro Pro Phe His Pro Gly Gin Ser Val Leu Leu His Arg Gin Pro 
245 250 255 

Asp Asp Val Trp Arg He Asp Phe Gin Leu Gly Trp Asp Ala Asp Pro 
260 265 270 

Glu Glu Glu Lys Lys Pro Glu Asn He Val Pro Arg He Arg Ala Leu 
275 280 285 

Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val Tyr Thr 
290 295 300 

Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val Val Phe 
305 310 .,315 ~ 320 

Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg Gly Ala 
325 330 " 335 

Asn Ser Gly Val Gin Asp Ala Glu Asn Leu Ala Trp Lys Leu Asp Arg 
340 345 350 

Val Leu Arg Gly Gin Ala Asp Ala Ser Leu He Ala Thr Tyr Gly Ala 
355 360 365 

Glu Arg Glu Tyr Ala Ala Asp Glu Asn He Arg Asn Ser Thr Arg Ala 
370 375 380 

Thr Asp Phe He Thr Pro Lys Ser Glu lie Ser Arg Leu Phe Ara Asp 
385 390 395 400 

Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg Il e Val 
405 410 415 

Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser Ala Leu 
420 425 430 

Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gin Leu Pro Gly Ala 
435 440 445 
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Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly Thr Ala 
9DU 455 460 

Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His ~Phe~Asp 
465 470 475 480 

Pro Thr Pro Ala Trp Ala Gin Ala Leu Pro Gly Val Leu Asn Leu Ser 
485 490 495 

He Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu He Asp 
= ,uu 505 510 

Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser 
515 520 525 

sto ^ P f« H±S Val CyS Ala **9 Tr P ^9 Arg Pro 

535 540 

Asp Glu Ala Ser Val Arg Ala Ala Leu Gin Arg Ala Cys Gly Ala" Ala " 
54i> 550 555 560 

Ala Thr Ala 

<210> 9 
<211> 966 
<212> ADN 

<213> Pseudonionas acidovorans 

<220> 

<221> CDS 

<222> (1) . . (966) 

<400> 9 

£ S S £ S £ E £ E E E £ ffi £ SI SS " 

5 10 15 

va? Sf P° f ag x tC tc ° gag Cac gcc tat 9 CC ta ^ acg gee gaa 96 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 

25 3 0 

ggc gac ccc aac ace ggc ate ate att ggc -gac gac gcg gtg ato at a 144 
Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp IS Val Met Val 
35 40 45 



i -S 3 E S S £ £ E S £ £ £ S E 192 

£ SS S? £ S E £ E £ IS £ £ S 22 £ £ 2 " 

70 75 80 

£ E S S3 £ S3 22 IS s £ E £ £ E I" £ 288 

85 90 • •* 



Ha III Ss S~ ?2 c g ° g3C 3CC tac aac ctc ate gtg gag 

Ala Glu Hrs lie n e Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 

105 110 



336 



E m K £ £ E IS H £ 85 £ £ £ £ £ ~ 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 4 32 
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Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg :cag 480 
Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

ate ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528 
lie Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

ctg ccc cag gac aag gtg ctg ttc age ggc gac ctg gtg gag ttc ggc 576 
Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

gec acg ccc tat gcg ggc gat gec tac ttc cag gac tgg ccg cac acg 624 
Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

ctg gac gec ate gec gee ctg cag ccc gaa aag etc gtg ccc ggc egg 672 
Leu Asp Ala lie Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

ggc gec gcg ctg cag acg ccg gee gag gtg cag gee ggc ctg gee ggc 720 
Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

acg cgc gac ttc ate age gac ctg tgg acc gag gtc aag gee ggc gee 768 
Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

gat gec cag cag gac ctg cgc aag gtc tac gag gee gee ttc gee aag 816 
Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

ctg cag ccc aag tac ggc cag tgg gtg ate ttc aac cac tgc atg ccc 864 
Leu Gin Pro Lys Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro 
275 280 285 

ttc gat gtg acc cgc gee tat gac gag gca teg ggc cac gee gac cca 912 
Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 
290 295 300 

cgc ate tgg acc gee gag cgc gac cgc cag atg tgg ctg gcg etc gaa 960 
Arg He Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 

ggc tga 966 
Gly 

<210> 10 
<211> 322 
<212> 

<213> Pseudomonas acidovorans 
<400> 10 

Met Thr Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu He Lys Gin 
1 5 10 15 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Ara 
50 55 60 



BNSDOCID. <WO 0236787A2_i_> 



WO 02/36787 J9 PCT/FR01/03364 

lie Arg Glu Val Thr Asp Lys Pro lie Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Giy 
85 90 95 

Ala Glu His lie He Ala Ser Gin Asp Thr Tyr Asp Leu lie Val Glu 
100 105 no 

Arg Gly Glu Gin Asp Lys Ala Ser Glu lie Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 

135 14Q 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 i 6 o 

lie Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp " 
165 170 175 

Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 i 8 5 • 19{) * 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

Leu Asp Ala lie Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 

230 235 240 

Thr Arg Asp Phe lie Ser Asp Leu Trp Thr Glu Val Lys Ala Glv Ala 
245 250 255 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

Leu Gin Pro Lys Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro 
275 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 



Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 



300 
Trp 

315 320 



Gly 



<210> 11 
<211> 966 
<212> ADK 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<220> 

<221> CDS 

<222> (1)..(966) 

<400> 11 

atg tec acc aag acc ttt gec tec gec gec qac etc aaa atr 

Met ser Thr Lys Thr Phe Ala Ser fla Ala Isp Leu llu fie Lyf G?n " 
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gtc age ttc gac aag etc tec gag cac gec tat gec tac acg gec gaa 96 
Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr AI3. Glu 
20 25 30 

ggc gac ccc aac acc ggc ate ate att ggc gac gac gcg gtg atg gtg 14 4 
Gly Asp Pro Asn Thr Gly lie lie lie Gly Asp Asp Ala Val Met Val 
35 40 45 

ate gac acc cag gec acg ccc gtc atg gee cag gac gtg ate cgc cgc 192 
lie Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val lie Arg Arg 
50 55 60 

ate-egt gag gtc acg gac aag ccc ate aag tac gtg acg ctg teg cac 240 
lie Arg Glu Val Thr Asp Lys Pro lie Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

tac cac gcg gtg cgc gtg ctg ggc gee teg gec ttc ttc gcg gaa ggc 288 
Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu ~Gly 
85 90 95 

gec gaa cac ate att gec age cag gac acc tac gac etc ate gtg gag 336 
Ala Glu His lie He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

cgc ggc gag cag gac aag gee age gag ate ggc cgc ttt ccc cgc ctg 384 
Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 432 
Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 14 0 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480 
Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

ate ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528 
lie Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 " 175 

ctg ccc cag gac aag gtg ctg ttc age ggc gac ctg gtg gag ttc ggc 57 6 
Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

gee acg ccc tat gcg ggc gat gee tac ttc cag gac tgg ccg cac acg 624 
Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

ctg gac acc ate gec gec ctg cag ccc gaa aag etc gtg ccc ggc egg 672 
Leu Asp Thr He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

ggc gec gcg ctg cag acg ceg gee gag gtg cag gec ggc ctg gee ggc 720 
Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

acg cgc gac ttc ate age gac ctg tgg acc gag gtc aag gee ggc gec 768 
Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

gat gee cag cag gac ctg cgc aag gtc tac gag gec gec ttc gec aag 816 
Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

ctg cag ccc aag tac ggc cag tgg gtg ate ttc aac cac tgc atg ccc 864 
Leu Gin Pro Lys Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro 
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275 280 285 

Phi JSd Si 5S £™ ^ ? aC gag gCa tcg 99c cac gcc gac cca 912 
ASP Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp -J*ro 
^ yo 295 300 



175 



Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 i 8 5 lgo * 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
x *° 200 205 

Leu Asp Thr He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
225 Ala Ala Leu Gln ^ Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 



966 



A?a lie £r£ I?f r? g » 9C ga ° ° gC Cag atg tgg ct 9 9cg etc gaa 960 
Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 

■ 05 310 315 320 

ggc tga 
Gly 

<210> 12 

<211> 322 • 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<400> 12 

Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu He Lys Gin 
1 5 10 ' 15 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

Gly Asp Pro Asn Thr Gly lie He He Gly Asp Asp Ala Val Met Val 
35 40 45 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 
. ou 55 go 

lie Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
bb 70 75 so 

Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Glv 
85 90 95 

Ala Glu His lie He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 no 

Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
XJU 135 i4o 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
. 150 155 i 6 o 

He Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
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_245 250 255 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 _ m 

Leu Gin Pro Lys Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro 
275 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro- 
290 295 300 

Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 

Gly 

<210> 13 
<211> 966 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<220> 

<221> CDS 

<222> (1) . . (966) 

<400> 13 

atg tec acc aag acc ttt gec tec gec gec gac etc gaa ate aag cag 48 

Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 
1 ' 5 10 15 

gtc age ttc gac aag etc tec gag cac gec tat gee tac acg gee gaa 96 
Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

ggc gac ccc aac acc ggc ate ate att ggc gac gac gcg gtg atg gtg 144 
Gly Asp Pro Asn Thr Gly lie He lie Gly Asp Asp Ala Val Met Val 
35 4 0 45 

ate gac acc cag gee acg ccc gtc atg gee cag gac gtg ate cgc cgc 192 
He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val lie Arg Arg 
50 55 60 

ate cgt gag gtc acg gac aag ccc ate aag tac gtg acg ctg teg cac 240 
lie Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

tac cac gcg gtg cgc gtg ctg ggc gec teg gec ttc ttc gcg gaa ggc 288 
Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

gee gaa cac ate att gec age cag gac acc tac gac etc ate gtg gag 336 
Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

cgc ggc gag cag gac aag gec age gag ate ggc cgc ttt ccc cgc ctg 384 
Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 432 
Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480 
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Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 

50 15 5 160 



? tg ^f 9 f t9 ggC cgc ggc cac acc aag ggc gac acc qto-rtcJwo 52B 
He Leu Gin Leu Gly Arg Gly His Thr Lyl Gly Asp Thr Si Va^lr? 

165 170 175 

e e s e a sa-sa e is e e e e e e B ™ 

180 185 190 Y 

mw 9 S C ° tat gCg ggc gat gcc tac ttc cag gac tqa cca cac arW r->a 
Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Lp Tr? fro His ?h? ' 

200 205 



E IS E E E E E S E E a a S3 e s si 672 

215 220 

§ E H 22 S S E E IS ?3 a E E E E 15 720 



K2 So So tS o 9C g3C f tg tgg aec gag gtc-a ag gcc ggc gcc 768 
inr Arg Asp Phe lie Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 

245 250 255 

Isp Ala G?n r?n ? a ° f tg ^ aag gtc tac gag gcc gcc gcc aag 816 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 



E a E E £ EE S S3 E E E E E S3 E 86 < 

28 0 285 

E E E E S E E E E E E 85 E E E E 912 



E E E E S ffl E E E E E E E E E E 960 

310 315 32Q 

ggc tga 

Gly 966 

<210> 14 
<211> 322 
<212> 

<213> Sequence artificielle 

<223> EE p E?.E;:EEE a *""«^"- «*«* 

<400> 14 

Met ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 

Val ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 

25 30 
Gly Asp Pro Asn Thr Gly He lie He Gly Asp Asp Ala Val Met Val 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val Il e Arg Arg 



He Arg Glu Val Thr Asp Lys Pro lie Lys Tyr Val Thr Leu 



Ser His 
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65 70 75 80 

Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 .95 — 

Ala Glu His lie He Ala Ser Gin Asp Thr Tyr Asp Leu lie Val Glu 
100 105 HO 

Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

Thr- Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu .Val Gin 
i45 150 155 160 

He Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

Leu Pro Glh Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 * 190 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

Leu Asp Ala lie Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

Leu Gin Pro Lys Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro 
275 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 
290 295 300 

Arg He Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
3 °5 310 315 320 

Gly 

<210> 15 
<211> 354 9 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d 1 expression 

<220> 

<221> promoter 
<222> (1)..(928) 

<220> 
<221> CDS 

<222> (965) .,(2647) 
<220> 
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<221> terminator. 
<222> (2811) .. (3549) 

<400> 15 

tgcatgccta ggtcgaggag aaatatgagt cgaggcatgg atacactaag ttcccctgaa 60 

gtgagcatga tctttgatgc tgagatgatt eccagagcaa gatagtttgt gctgcaagtg 120 

acacaattgt aatgaaacca ccactcaacg aatttacttg tggctttgac atgtcgtgtg 180 

ctctgtttgt atttgtgagt gccggttggt aattattttt gttaatgtga ttttaaaacc 240 

tcttatgtaa atagttactt tatctattga agtgtgttct tgtggtctat agtttctcaa 300 

agggaaatta aaatgttgac atcccattta caattgataa cttggtatac acaaactttg 360 

taaatttggt gatatttatg gtcgaaagaa ggcaataccc attgtatgtt ccaatatcaa 420 

tatcaatacg ataacttgat aatactaaca tatgattgtc attgtttttc cagtatcaat 480 

atacattaag ctactacaaa attagtataa atcactatat tataaatctt tttcggttgt 540 

aacttgtaat tcg tgggttt ttaaaataaa agcatgtgaa aattttcaaa taatgtgatg 600 

gcgcaatttt attttccgag ttccaaaata ttgccgcttc attaccctaa tttgtggcgc 660 

cacatgtaaa acaaaagacg attcttagtg gctatcactg ccatcacgcg gatcactaat 720 

atgaaccgtc gattaaaaca gatcgacggt ttatacatca ttttattgta cacacggatc 780 

gatatctcag ccgttagatt taatatgcga tctgattgct caaaaaatag actctccgtc 84 0 

tttgcctata aaaacaattt cacatctttc tcacccaaat ctactcttaa ccgttcttct 900 

tcttctacag acatcaattt ctctcgactc tagaggatcc aagcttatcg atttcgaacc 960 

cctc atg act tea ctt aca gtg tec ggc egg gtg gcg cag gtc etc aac 1009 
Met Thr Ser Leu Thr Val Ser Gly Arg Val All Gin vl? Su Ilr 

sir HI val lit 22 ^? lu° ^tg atg ggc aac gga aac gte tac 1057 

Ser Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr 

25 30 

Ph^ it?, ??° g f° 2f g aag ga ^ 9S C ctccgc ttc acg gee gta cgc 1105 

Phe Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala vS A^g 

35 40 45 

His Glu riv A?f 11° ™° ?? 9 gcg 9Cg gac gcc tac ta * egg gca tec 
His Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser 



1153 



60 



1201 



ggg cgc ctg gcg gcg ggg acc acc acc tac ggc ccc got tac acc aac 
Gly Arg Leu Ala Ala Gly Thr Thr Thr Tyr I!y Pro !fy Tyr ?hr Asn 

70 75 

K 22 S S £ S S! H «S SfflS S ?™ M 1219 

85 90 95 

S !S Thr SC Sp E Pro S S |g ffi S Ire g. g tf ^ 



Asp l?n Ha A?a ?? C ?? C f? C ° tg ggg gcg gcg acc ttc *<=g 

Asp Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val 



1345 



125 
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acc cgt gaa gcc gca ggc tec ate acg cag gaa gcg gtg gag tac gca 1393 

Thr Arg Glu Ala Ala Gly Ser lie Thr Gin Glu Ala Val Glu Tyr Ala 
130 135 140 

ctt gcc egg egg acc gcc gtc gtg ate gcc gtt cca tac gac ctg teg 1441 

Leu Ala Arg Arg Thr Ala Val Val lie Ala Val Pro Tyr Asp Leu Ser 
145 150 155 

gcc ctt gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc teg 1489 

Ala Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser 

160 165 170 175 

gtt ccg gac gcc ate ggc ggc gga etc gga egg gcg gee gaa gtg egg 1537 
Val Pro Asp Ala lie Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg 
180 185 .190 

gcg gcc gaa ttg ctg gcg ggc gcg aag egg ccg etc. ate ctt gcc ggc 1585 

Ala Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu lie Leu Ala Gly 

195 200 205 

cgc ggt gcg cac etc gca gga acc ggc ccc gaa etc egg gaa etc gcc 1633 

Arg Gly Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala 
210 215 : 220 

gac cgc etc ggc gcg etc acg gcc ggc acc gca ctg gcg ctg aac ctg 1681 

Asp Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu 
225 230 235 

ctg cag ggc gag ggg tac etc ggc gtc gcg ggc ggc t,tc ggc acg gat 1729 

Leu Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp 

240 245 250 255 

acc gcc gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga 1777 

Thr Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly 
260 265 270 

gcc age ctg acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg 1825 

Ala Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu lie Gly Pro 

275 280 285 

gac gcc acc gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg 1873 

Asp Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro 
290 295 300 

egg gtg gac ctg ttt gtc agt gcg gac gcg aag gcc get gee ggc egg 1921 

Arg Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg 
305 310 315 

ate etc egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc 1969 

He Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala 

320 325 330 335 

tgg cgc gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac 2017 

Trp Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His 
340 345 350 

ccc ggc acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt 2065 

Pro Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu 

355 360 365 

get teg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag 2113 

Ala Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin 
370 375 380 

gac ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc 2161 

Asp Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro 
385 390 395 
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25 S"lff^«-8g.Sg-83-S 5£ I? g ^ c ^ g tcg atc ggg 2209 

400 ^nc al Gly Thr Ala Gln Ser He Gly 

410 415 

22 85 21 E ffi E ffi G?? Iff ffi ffi S ffi ffi ffi" ffi »» 

425 43Q 
K ffi ffi ffi 22 E E IS ffi Gly ffi ffi ffi ffi IS 2- -2305 

440 445 

s e a iK s a.sa s s e is is e ss & & 

455 460 

s fg e e K E ffi ffi E III ffi ffi 2.g - 

470 475 

H ™ a ffi K3 5 ffi ffi £S ffi ffi E 2 " 9 

49Q 



ffi S E S| ffi ffi ffi E ffi £ E ffi ffi ffi IS ffi ^ 



2545 



ffi E ffi ffi E ffi ffi ffi ffi ffi ffi E ffi E ffi ffi 

520 525 

ffi ffi ffi E ffi ffi ffi ffi ffi ffi ffi ffi J- K s 

535 54Q 

ffi ffi ffi ffi ffi ffi ffi ffi ffi E E ffi s ffi ffi H .«» 

555 

ggc tag ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca 2697 
560 

gggcgttctc agggctggga acgccctgag ctgctactca tttgttcgaa ctcgaggtcg 2757 
acggtatcga taagcttgat atcgaattcc tgcagcccgg gggatccact aggggatccc 2817 
ccgatccgcg tttgtgtttt ctgggtttct cacttaagcg tctgcgtttt acttttgtat 2877 
tgggtttggc gtttagtagt ttgcggtagc gttcttgtta tgtgtaatta cgctttttct 2937 
tcttgcttca gcagtttcgg ttgaaatata aatcgaatca agtttcactt tatcagcgtt 2997 
gttttaaatt ttggcattaa attggtgaaa attgcttcaa ttttgtatct aaatagaaga 3057 
gacaacatga aattcgactt ttgacctcaa atcttcgaac atttatttcc tgatttcacg 3117 
atggatgagg ataacgaaag ggcggttcct atgtccggga aagttcccgt agaagaoaat 3177 
gagcaaagct actgaaacgc ggacacgacg tcgcattggt acggatatga gttaaaccga 3237 
ctcaattcct ttattaagac ataaaccgat tttggttaaa gtgtaacagt gagctgatat 3297 
aaaaccgaaa caaaccggta caagtttgat tgagcaactt gatgacaaac ttcagaattt 3357 
tggttattga atgaaaatca tagtctaatc gtaaaaaatg tacagaagaa aagctagagc 3417 
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agaacaaaga ttctatattc tggttccaat ttatcatcgc tttaacgtcc ctcagatttg 3477 
atcgggctgc aggaattcgg cctgactgat catttaaaca ctagttctag agcggccgcc 3537 
accgcggtgg ag " 3549 

<210> 16 
<211> 241 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: cassette 
d 1 expression 

<40D> 16 

Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
1 5 10 15 

Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
20 25 30 

Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
35 40 45 

Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
50 55 60 

Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg lie Pro Arg 
65 70 75 80 

Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser lie Gly Leu 
85 90 95 

Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn 
100 105 110 

He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
115 120 125 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
130 135 140 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 
145 150 155 160 

Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly 
165 170 175 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 
180 185 190 

Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
195 200 205 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
210 215 220 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
225 230 235 240 

<210> 17 
<211> 2838 
<212> ADN 

<213> Sequence artificielle 

<220> - 
<223> Description de la sequence artificielle: cassette 
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d • expression.; . 

<220> 

<221> promoter 

<222> (1) . . (807) - - _-. 

<220> 
<221> CDS 

<222> (847) . . (2538) 
<220> 

<221> terminator 
<222> (2539) .. (2838) 

<400> 17 

ggccccccct cgagcccaca gatggttaga gaggettacg cagcaggtct catcaagacg 60 

atctacccga gcaataatct ccaggaaatc aaataccttc ccaagaaggt taaagatgca 120 

gtcaaaagat tcaggactaa ctgcatcaag aacacagaga aagatatatt tctcaagatc 180 

agaagtacta ttcoagtatg gacgattcaa ggcttgcttc acaaaccaag gcaagtaata 240 

gagattggag tctctaaaaa ggtagttccc actgaatcaa aggccatgga gtcaaagatt 300 

caaatagagg acctaacaga actcgccgta aagactggcg aacagttcat acagagtctc 360 

ttacgactca atgacaagaa gaaaatcttc gtcaacatgg tggagcacga cacacttgtc 420 

tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa 480 

caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt 540 

gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 600 

gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 660 

agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat 720 

atctccactg aogtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 780 

atataaggaa gttcatttca tttggagaga acacggggga ctctagagga tcagaggacg 840 

aacaac atg tec oao ccc gec ate tec ctg caa gcg ctg cgc aac aac 88ft 
Met Ser His Pro Ala He Ser Leu Gin 111 Leu £rg Jfy sir 



10 



°ii S S S SS £ lit S III S £ ill S2 SS K,K 

25 30 



936 



S a E !f y a S P B IS S SS 2 a a 85 £ ?5 984 

35 40 45 

m K SS S 83 SK 22 S a K ill a 22 K a S| 1032 

55 60 

25 a a a a a a a a a & s? 22 a a a 1080 
a a a a a a a a a a 22 a a a a a 1128 

85 90 
ctg ggc gtg ggc cag ccc atg gtg gac aag ggc gtg tec tgg aac ctg 



1176 
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Leu Gly Val Gly SSn Pro Met Val Asp Lys Gly Val Ser Tip Asn Leu 
95 100 105 110 

ggc aag gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg" ctg 1224 
Gly Lys Val Phe Phe Lys Asp Gin Pro Leu Tyr Arg Phe Asp Leu Leu 
115 120 ^ 125 

ccc gag gac ggc cac gag cgc ccg gcc ttc ate aac ctg cag cag tac 1272 
Pro Glu Asp Gly His Glu Arg Pro Ala Phe lie Asn Leu Gin Gin Tyr 
130 135 140 

tac gcc gag gcc tat ctg gtc gag cgc gca ctg cag ctg ccg ctg ate 1320 
Tyr Ala Glu Ala Tyr Leu Val Glu Arg Ala Leu Gin Leu Pro Leu lie 
145 150 155 

gac ctg cgc tgg cac age aag gtc acg gca ctg gag ccg cag gcc gag 1368 
Asp Leu Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gin Ala Glu 
160 165 170 

ggc gcg ctg ctg acc gtg gag acg cct gac ggc age tac cgc ate gat 1416 
Gly Ala Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg lie Asp 
175 180 185 ^ 190 

gcg caa tgg gtc ctg gcc tgc gat ggc teg cgc teg ccg ctg cgc ggc 1464 
Ala Gin Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly 
195 200 205 

ctg ctg ggc cag gaa age cat ggc cgc ate ttc cgc gac cgc ttc ctg 1512 
Leu Leu Gly Gin Glu Ser His Gly Arg lie Phe Arg Asp Arg Phe Leu 
210 215 220 

ate gcc gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc 1560 
He Ala Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe 
225 230 235 

tgg ttc gac ccg ccc ttc cac ccg ggc cag age gtg ctg ctg cac cgc 1608 
Trp Phe Asp Pro Pro Phe His Pro Gly Gin Ser Val Leu Leu His Arg 
240 245 250 

cag ccc gac gat gtc tgg cgc ate gac ttc cag ctg ggc tgg gac gcg 1656 
Gin Pro Asp Asp Val Trp Arg lie Asp Phe Gin Leu Gly Trp Asp Ala 
255 260 265 270 

gac ccc gag gaa gag aaa aag ccc gag aac ate gtg ccg cgc ate cgc 1704 
Asp Pro Glu Glu Glu Lys Lys Pro Glu Asn He Val Pro Arg lie Arg 
275 280 285 

gcc ctg ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc age gtc 1752 
Ala Leu Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val 
290 295 300 

tac acc ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg 1800 
Tyr Thr Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val 
305 310 315 

gtc ttt gcg ggc gac age gcc cac ggc gtc teg ccg ttt ggc gca cgc 184 8 
Val Phe Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg 
320 325 330 

ggc gcc aac age ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg 1896 
Gly Ala Asn Ser Gly Val Gin Asp Ala Glu Asn Leu Ala Trp Lys Leu 
335 340 345 350 

gac cgc gtg ctg cgc ggc cag gcc gat gcc teg ctg ate gcc acc tac 1944 
Asp Arg Val Leu Arg Gly Gin Ala Asp Ala Ser Leu He Ala Thr Tyr 
355 360 365 * 

ggc gcc gag cgc gaa tac gcg gcc gac gag aac ate cgc aac tec acg 1992 
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Gly Ala Glu Arg Glu Tyr Ala Ala Asp Glu Asn He Arg Asn Ser Thr 

a a in a S & B IS » a S a I- 25 fi.~ -o 

390 395 

2? ss a as a s a a a a a a ss a 2088 

405 

!il ~ - K K i 22 SS S3 S K-S 22 S -85 S 2136 

425 430 

IS 2S 2S B S K S S S IS S SJ S 2&S 2 - 

440 445 

S S S3 2 K 5 S S 2S a a a K L" IS * 32 

455 450 

b a fg a a e a a a a a a a a 2280 

470 475 

a a a a a a a a a a a a a a a a 2228 

485 490 ' 

a a a a a a a ss a ss a a a a a a 2326 

505 510 

a a a a a a a a a a a a a a a a 2424 

520 525 

a a a a a a si a a a a a a a a a 2422 

535 54 0 

a a a a a a a a a a a a a a a a 2520 

550 555 

K III 82 SS 2S aCCtcttaa 9 cttatcgata ccgtcgacga 2568 

560 

atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 2628 
gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta ataattaaca 2688 
tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 2748 
tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg 2808 
tgtcatctat gttcctaggt cgggaattgc 

2838 

<210> 18 
<211> 284 
<212> 

<213> Sequence artif icielle 

<223> S"SSssion de 13 S6qU6nCe ^"icielle: cassette 
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<400> 18 

lie Val Pro Arg lie Arg Ala Leu Leu Gly Lys Asp Ala Pro Phe Glu 
15 10 _15. 

Leu Glu Trp Ala Ser Val Tyr Thr Phe Ala Cys Leu Arg Met Asp Arg 
20 25 30 

Phe Val His Gly Arg Val Val Phe Ala Gly Asp Ser Ala His Gly Val 
35 40 45 

Ser Pro Phe Gly Ala Arg Gly Ala Asn Ser Gly Val Gin Asp Ala Glu 
50 55 60 

Asn Leu Ala Trp Lys Leu Asp Arg Val Leu Arg Gly Gin Ala Asp Ala 
65 70 75 80 

Ser Leu lie Ala Thr Tyr Gly Ala Glu Arg Glu Tyr Ala Ala Asp Glu 
85 90 95 _ 

Asn lie Arg Asn Ser Thr Arg Ala Thr Asp Phe lie Thr Pro Lys Ser 
100 105 110 

Glu lie Ser Arg Leu Phe Arg Asp Ala Val Leu Asp Leu Ala Arg Asp 
115 120 125 

His Glu Phe Ala Arg Arg lie Val Asn Ser Gly Arg Leu Ser Val Pro 
130 135 140 

Ala Thr Leu His Gly Ser Ala Leu Asn Thr Pro Asp Thr Asp Thr Phe 
145 150 155 K 160 

Asp Gly Thr Gin Leu Pro Gly Ala Val Leu Ala Asp Ala Pro Met Arg 
165 170 ^ 175 

Arg Pro Gly Ala Asp Gly Thr Ala Trp Leu Leu Arg Ala Leu Gly Pro 
180 185 190 

Asp Phe Thr Leu Leu His Phe Asp Pro Thr Pro Ala Trp Ala Gin Ala 
195 200 205 

Leu Pro Gly Val Leu Asn Leu Ser lie Ala Ala Glu Gly Glu Ala His 
210 215 220 

Ala Pro Asp Ala Asp Leu lie Asp Ala Arg Gly Leu Ala Ala Lys Arg 
225 230 235 240 

Leu Asp Ala Arg Pro Gly Thr Ser Tyr Leu Leu Arg Pro Asp Gin His 
245 250 255 

Val Cys Ala Arg Trp Arg Arg Pro Asp Glu Ala Ser Val Arg Ala Ala 
260 265 270 

Leu Gin Arg Ala Cys <?ly Ala Ala Ala Thr Ala 
275 280 



<210> 19 
<211> 1839 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d f expression 

<220> 

<221> promoter 



Q236787A2 I > 



WO 02/36787 

33 PCT/FR01/03364 

<222> (1) . . {547L 

<220> 
<221> CDS 

<222> (574) (1539) - ~ ~~ 



<220> 

<221> terminator 
<222> (1540).. (1839) 

<400> 19 

ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat 60 
eaagaatcca atgtttacgg gaaaaaetat ggaagtatta tgtgagctca gcaagaagca 120 
gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga 180 
tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga 24 0 
agaaaagaat cttgaagacg taagcactga cgaoaacaat gaaaagaaga agataaggtc 300 
ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt 360 
aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca 420 
tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa 480 
aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta 54 0- 
agtttgtaga tctgaattcg atgcaggatg cac atg tec acc aag acc ttt gec 

Met Ser Thr Lys Thr Phe Ala 



594 



1 ~ 5 



i= & B IS SS IS !S Sf a «5 SS £ L« SS £ is 



20 



642 



690 



SS His SS S Sr S Ala S* 2?° T C CCC aaC aCC ate 

25 y Glu Gly Ppo Asn Thr Gly He 

- J0 35 

SS s SS SS IS ffi *r s?£?ss ss. S IS IS K SS " 8 

5 1 50 55 

S! S? IS a SS S SI SI S SS IS «j g 5 »f »« 



SS SS 5* SS E? s 22 a k - ~ ffi faf » ^ ffl 



834 



85 



1?? IS SI IS £ IS IS ffi gg SS a SS IS Si IS E 882 

95 100 

SS IS IS SS IS SS SS S3 SS S SS IS SS IS 5! IS "° 
ffS IS SS IS IS SS SS SS SS IS SS S! IS SS S3 

135 

SS K IS S? SS IIS SS SS SS SS SS SS IS SI S? ■ ffi "»« 



145 150 
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ctg tgg ctg ggc aag ctg gaa gtg cag ate ctg cag ctg ggc cgc ggc 1074 
Leu Trp Leu Gly Lys Leu Glu Val Gin lie Leu Gin Leu Gly Arg Gly 
155 160 165 - - 

cac acc aag ggc gac acc gtg gtc tgg ctg ccc cag gac aag gtg ctg 1122 
His Thr Lys Gly Asp Thr Val Val Trp Leu Pro Gin Asp Lys Val Leu 
170 175 180 

ttc age ggc gac ctg gtg gag ttc ggc gec acg ccc tat gcg ggc gat 1170 
Phe Ser Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr Ala Gly Asp 
185 190 195 

gec tac ttc cag gac tgg ccg cac acg ctg gac gec ate gec gec ctg 1218 
Ala Tyr Phe Gin Asp Trp Pro His Thr Leu Asp Ala lie Ala Ala Leu 
200 205 210 215 

cag ccc gaa aag etc gtg ccc ggc egg ggc gee gcg ctg cag acg ccg 1266 
Gin Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu Gin Thr _Pro 
220 225 230 

gec gag gtg cag gee ggc ctg gee ggc acg cgc gac ttc ate age gac 1314 
Ala Glu Val Gin Ala Gly Leu Ala Gly Thr Arg Asp Phe lie Ser Asp 
235 240 245 

ctg tgg acc gag gtc aag gee ggc gee gat gee cag cag gac ctg cgc 1362 
Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gin Gin Asp Leu Arg 
250 255 260 

aag gtc tac gag gee gee ttc gee aag ctg cag ccc aag tac ggc cag 1410 
Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gin Pro Lys Tyr Gly Gin 
265 270 275 

tgg gtg ate ttc aac cac tgc atg ccc ttc gat gtg acc cgc gee tat 1458 
Trp Val lie Phe Asn His Cys Met Pro Phe Asp Val Thr Arg Ala Tyr 
280 285 290 295 

gac gag gca teg ggc cac gee gac cca cgc ate tgg acc gee gag cgc 1506 
Asp Glu Ala Ser Gly His Ala Asp Pro Arg lie Trp Thr Ala Glu Arg 
300 305 310 

gac cgc cag atg tgg ctg gcg etc gaa ggc tga tgcaagctta tegatacegt 1559 
Asp Arg Gin Met Trp Leu Ala Leu Glu Gly 
315 320 

cgacgaattt ccccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg 1619 

ttgeeggtet tgegatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa 1679 

ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat 1739 

tatacattta atacgegata gaaaacaaaa tatagegege aaactaggat aaattatege 1799 

gcgcggtgtc atctatgtta etagateggg aattgeggee 1839 

<210> 20 
<211> 142 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: cassette 
d' expression 

<400> 20 

Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr 
1 5 10 15 

Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr Leu Asp Ala lie 
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20 25 



30 



Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu 

40 45 - . 

Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly Thr Arg Asp Phe 

55 60 

lie Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gin Gin 

70 75 80 

Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gin Pro Lys 
85 go 



95 



Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro Phe Asp. Val Thr 
100 105 no 

Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro Arg He Trp Thr 
10 120 125 

Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu Gly 
130 135 140 

<210> 21 
<211> 4 677 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d' expression 

<400> 21 

ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat 60 
caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca 120 
gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga 180 
tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga 240 
agaaaagaat cttgaagacg taagcactga cgacaacaat gaaaagaaga agataaggtc 300 
ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt 360 
aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca 420 
tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa 480 
aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta 540 
agtttgtaga tctgaattcg atgcaggatg cacatgtcca ccaagacctt tgcctccgcc 600 
gccgacctcg aaatcaagca ggtcagcttc gacaagctct ccgagcacgc ctatgcctac 660 
acggccgaag gcgaccccaa caccggcatc atcattggcg acgacgcggt gatggtgatc 720 
gacacccagg ccacgcccgt catggcccag gacgtgatcc gccgcatccg tgaggtcacg 780 
gacaagccca tcaagtacgt gacgctgtcg cactaccacg cggtgcgcgt gctgggcgcc 840 
tcggccttct tcgcggaagg cgccgaacac atcattgcca gccaggacac ctacgacctc 900 
atcgtggagc gcggcgagca ggacaaggcc agcgagatcg gccgctttcc ccgcctgttc 960 
cagaacgtgg aaagcgtgcc cgatggcatg acctggccca ccctcacctt caccggcaag 1020 
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atgacgctgt ggctgggcaa gctggaagtg cagatcctgc agctgggccg cggccacacc 1080 
aagggcgaca ccgtggtctg gctgccccag gacaaggtgc tgttcagcgg cgaectggtg 1140 
gagttcggcg ccacgcccta tgcgggcgat gcctacttcc aggactggcc gcacacgctg 1200 
gacgccatcg ccgccctgca gcccgaaaag ctcgtgcccg gccggggcgc cgcgctgcag 1260 
acgccggccg aggtgcaggc cggcctggcc ggcacgcgcg acttcatcag cgacctgtgg^ 1320 
accgaggtca aggccggcgc cgatgcccag caggacctgc gcaaggtcta cgaggccgcc 1380 
ttcgccaagc tgcagcccaa gtacggccag tgggtgatct tcaaccactg catgcccttc 14 40 
gatgtgaccc gcgcctatga cgaggcatcg ggccacgccg acccacgcat ctggaccgcc 1500 
gagcgcgacc gccagatgtg gctggcgctc gaaggetgat gcaagcttat cgataccgtc 1560 
gacgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 1620 
tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 1680 
taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 1740 
atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 1800 
cgcggtgtca tctatgttac tagatcggga attgcggccc cccctcgagc ccacagatgg 1860 
ttagagaggc ttacgcagca ggtctcatca agacgatcta cccgagcaat aatctccagg 1920 
aaatcaaata ccttcccaag aaggttaaag atgcagtcaa aagattcagg actaactgca 1980 
tcaagaacac agagaaagat atatttctca agatcagaag tactattcca gtatggacga 2040 
ttcaaggctt gcttcacaaa ccaaggcaag taatagagat tggagtctct aaaaaggtag 2100 
ttcccactga atcaaaggcc atggagtcaa agattcaaat agaggaccta acagaactcg 2160 
ccgtaaagac tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa 2220 
tcttcgtcaa catggtggag cacgacaqac ttgtctactc caaaaatatc aaagatacag 2280 
tctcagaaga ccaaagggca attgagactt ttcaacaaag ggtaatatcc ggaaacctcc 2340 
tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg 2400 
gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg 2460 
acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc 2520 
caaccacgtc ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg 2580 
cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg 2640 
agagaacacg ggggactcta gaggatcaga ggacgaacaa catgtcccac cccgccatct 2700 
ccctgcaagc gctgcgcggc agcggcgcag acatacagtc catccacatc ccctacgagc 2760 
gccatgccga ccaggacgcc ggtgcggaca cgcccgcccg gcatcccgtc gtcatcgtcg 2820 
gcgccggccc cgtgggcctg tcgctggcca tcgacctggc ccagcgcggc cagcgcgtgg 2880 
tgctgctgga caacgactgc cggctgtcca cgggctcgcg cgccatctgc ttttccaagc 2940 
gcacgctgga gatctgggac cgcctgggcg tgggccagcc catggtggac aagggcgtgt 3000 
cctggaacct gggcaaggtc ttcttcaagg accagccgct gtaccgcttc gacctgctgc 3060 
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ccgaggacgg ccacgagcgc ccggccttca tcaacctgca gcagtactac gccgaggcct 3120 
atctggtcga gcgcgcactg cagctgccgc tgatcgacct gcgctggcac agcaaggtca 3180 
cggcactgga gccgcaggcc gagggcgcgc tgctgaccgt ggagacgcct gacgfcagct 3240 
accgcatcga tgogcaatgg gtcctggcct gcgatggctc gcgctcgccg ctgcgcggcc 3300 
tgctgggcca ggaaagccat ggccgcatct tccgcgaccg cttcctgatc gccgacgtga 3360 
agatgcacgc cgaattcccc accgagcgct ggttctggtt cgacccgccc ttccacccgg 3420 
gccagagcgt gctgctgcac cgccagcccg acgatgtctg gcgcatcgac ttccagctgg 3480 
gctgggacgc ggaccccgag gaagagaaaa agcccgagaa catcgtgccg cgcatccgcg 3540 
ccctgctggg caaggacgcg cccttcgagc tggaatgggc cagcgtctac accttcgcct 3600 
gcctgcgcat ggaccgcttc gtccatggcc gcgtggtctt tgcgggcgac agcgcccacg 3660 
gcgtctcgcc gtttggcgca cgcggcgcca acagcggcgt gcaggatgcc gagaacctgg 3720 
catggaagct ggaccgcgtg ctgcgcggcc aggccgatgc ctcgctgatc gccacctacg 3780 
gcgccgagcg cgaatacgcg gccgacgaga acatccgcaa ctccacgcgc gccaccgact 3840 
tcatcacgcc caagagcgag atcagccgcc tgtttcgcga cgccgtgctg gacctggcgc 3900 
gcgaccatga attcgcgcgc cgcatcgtca acagcgggcg gctgtccgtg ccggccacgc 3960 
tgcacggctc cgcgctcaac acgcctgaca ccgacacctt cgacggaacg cagctgcccg 4020 
gcgccgtgct ggccgatgcg cccatgcgcc ggcccggcgc agacggcacg gcctggctgc 4080 
tgcgcgcact gggaccggac ttcacgctgc tgcacttcga coccacgccc gcctgggcgc 4140 
aggcgctgcc cggcgtgctc aacctgtcca tcgcggccga gggcgaggcc catgcgccag 4200 
acgccgacct catcgatgcg cgcggcctgg cggccaaacg cctggatgca cgccccggca 4260 
ccagctacct gctgcggcct gaccagcatg tctgcgcgcg ctggcgccgc cccgacgaag 4320 
ccagcgtgcg cgccgcgctg caaagagcct gcggcgccgc cgccacggcc tgaacctctt 4380 
aagcttatcg ataccgtcga cgaatttccc cgatcgttca aacatttggc aataaagttt 4440 
cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tglttgaatta 4500 
cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat 4560 
gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa 4620 
ctaggataaa ttatcgcgcg cggtgtcatc tatgttccta ggtcgggaat tgcggcc 4677 

< ■ ■ 

<210> 22 
<211> 8187 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : cassette 
a expression 

<400> 22 

ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat 60 
caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca 120 
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gatcaatatg 


cggcacatat 


gcaacctatg 


tcctatactg 


ccagaatacg 


aagaagaata 


agaaaagaat 


cttgaagacg taagcactga 


ggtgattgtg 


aaagagacat 


agaggacaca 


aaccttatca 


caaaggaatc 


ttatccccca 


tttttgccct 


tgagttttcc 


tatataagga 


aaatttggtg 


taagctattt 


tctttgaagt 


agtttgtaga 


tctgaattcg 


atgcaggatg 


gccgacctcg 


aaatcaagca 


ggtcagcttc 


acggccgaag 


gcgaccccaa 


caccggcatc 


gacacccagg 


ccacgcccgt 


catggcccag 


gacaagccca 


tcaagtacgt 


gacgctgtcg 


tcggccttct 


tcgcggaagg 


cgccgaacac 


atcgtggagc 


gcggcgagca 


ggacaaggcc 


cagaacgtgg 


aaagcgtgcc 


cgatggcatg 


atgacgctgt 


ggctgggcaa 


gctggaagtg 


aagggcgaca 


ccgtggtctg 


gctgccccag 


gagttcggcg 


ccacgcccta 


tgcgggcgat 


gacgccatcg 


ccgccctgca 


gcccgaaaag 


acgccggccg 


aggtgcaggc 


cggcctggcc 


accgaggtca 


aggccggcgc 


cgatgcccag 


ttcgccaagc 


tgcagcccaa 


gtacggccag 


gatgtgaccc 


gcgcctatga 


cgaggcatcg 


gagcgcgacc 


gccagatgtg 


gctggcgctc 


gacgaatttc 


cccgatcgtt 


caaacatttg 


tgccggtctt 


gcgatgatta 


tcatataatt 


taacatgtaa 


tgcatgacgt 


tatttatgag 


atacatttaa 


tacgcgatag 


aaaacaaaat 


cgcggtgtca 


tctatgttac 


tagatcggga 


ttagagaggc 


ttacgcagca 


ggtctcatca 


aaatcaaata 


ccttcccaag 


aaggttaaag 


tcaagaacac 


agagaaagat 


atatttctca 


ttcaaggctt 


gcttcacaaa 


ccaaggcaag 


ttcccactga 


atcaaaggcc 


atggagtcaa 



ttcaaaaatg 


aagaatgtac 


agatacaaga 


180 


cgtagaaatt 


gaaaaagaag 


aacdagg.cga 


240 


cgacaacaat 


gaaaagaaga 


agataaggtc 


300 


tgtaaggtgg 


aaaatgtaag 


ggcggaaagt 


360 


ctacttatcc 


ttttatattt 


ttccgtgtca 


420 


accaagttcg 


gcatttgtga 


aaacaagaaa 


480 


actgaggata 


caacttcaga 


gaaatttgta 


540 


cacatgtcea 


ccaagacctt 


tgcctccgcc 


600 


gacaagctct 


ccgagcacgc 


ctatgcctac 


660 


atcattggcg 


acgacgcggt 


gatggtgatc 


720 


gacgtgatcc 


gccgcatccg tgaggtcacg 


780 


cactaccacg 


cggtgcgcgt gctgggcgcc 


840 


atcattgcca 


gccaggacac 


ctacgacctc 


900 


agcgagatcg 


gccgctttcc 


ccgcctgttc 


960 


acctggccca 


ccctcacctt 


caccggcaag 


1020 


cagatcctgc 


agctgggccg 


cggccacacc 


1080 


gacaaggtgc 


tgttcagcgg 


cgacctggtg 


1140 


gcctacttcc 


aggactggcc 


gcacacgctg 


1200 


ctcgtgcccg 


gccggggcgc 


cgcgctgcag 


1260 


ggcacgcgcg 


acttcatcag 


cgacctgtgg 


1320 


caggacctgc 


gcaaggtcta 


cgaggccgcc 


1380 


tgggtgatct 


tcaaccactg catgcccttc 


1440 


ggccacgccg 


acccacgcat 


ctggaccgcc 


1500 


gaaggctgat 


gcaagcttat 


cgataccgtc 


1560 


gcaataaagt 


ttcttaagat tgaatcctgt 


1620 


tctgttgaat 


tacgttaagc atgtaataat 


1680 


atgggttttt 


atgattagag 


tcccgcaatt 


1740 


atagcgcgca 


aactaggata 


aattatcgcg 


1800 


attgcggccc 


cccctcgagc ccacagatgg 


1860 


agacgatcta 


cccgagcaat 


aatctccagg 


1920 


atgcagtcaa 


aagattcagg 


actaactgca 


1980 


agatcagaag 


tactattcca 


gtatggacga 


2040 


taatagagat 


tggagtctct 


aaaaaggtag 


2100 


agattcaaat 


agaggaccta 


acagaactcg 


2160 
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ccgtaaagac tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa 2220 
tcttcgtcaa catggtggag cacgacacac. ttgtctactc caaaaatatc aaagaj^cag 2280 
tctcagaaga ccaaagggca, attgagactt ttcaacaaag ggtaatatcc ggaaacctcc 2340 
tcggattcca ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg 2400 
gctcctacaa atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg 2460 
acagtggtcc.caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc 2520 
caaccacgtc ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg 2580 
cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg 2640 
agagaacacg ggggactcta gaggatcaga ggacgaacaa catgtcccac cccgccatet 2700 
ccctgcaagc gctgcgcggc agcggcgcag acatacagtc catccacatc ccctacgagc 2760 
gccatgccga ccaggacgcc ggtgcggaca cgcccgcccg gcatcccgtc gtcatcgtcg 2820 
gcgccggccc cgtgggcctg tcgctggcca tcgacctggc ccagcgcggc cagcgcgtgg 2880 
tgctgctgga caacgactgc cggctgtcca cgggctcgcg cgccatctgc ttttccaagc 2940 
gcapgctgga gatctgggac cgcctgggcg tgggccagcc catggtggac aagggcgtgt 3000 
cctggaacct gggcaaggtc ttcttcaagg accagccgct gtaccgcttc gacctgctgc 3060 
ccgaggacgg ccacgagcgc ccggccttca tcaacctgca gcagtactac gccgaggcct 3120 
atctggtcga gcgcgcactg cagctgccgc tgatcgacct gcgctggcac agcaaggtca 3180 
cggcactgga gccgcaggcc gagggcgcgc tgctgaccgt ggagacgcct gacggcagct 3240 
accgcatcga tgcgcaatgg gtcctggcct gcgatggctc gcgctcgccg ctgcgcggcc 3300 
tgctgggcca ggaaagccat ggccgcatct tccgcgaccg cttcctgatc gccgacgtga 3360 
agatgcacgc cgaattcccc accgagcgct ggttctggtt cgacocgccc ttccacccgg 3420 
gccagagcgt gctgctgcac cgccagcccg acgatgtctg gcgcatcgac ttccagctgg 3480 
gctgggacgc ggaccccgag gaagagaaaa agcccgagaa catcgtgccg cgcatccgcg 3540 
ccctgctggg caaggacgcg cccttcgagc tggaatgggc cagcgtctac accttcgcct 3600 
gcctgcgcat ggaccgcttc gtccatggcc gcgtggtctt tgcgggcgac agcgcccacg 3660 
gcgtctcgcc gtttggcgca cgcggcgcca acagcggogt gcaggatgcc gagaacctgg 3720 
catggaagct ggaccgcgtg ctgcgcggcc aggccgatgc ctcgctgatc gccacctacg 3780 
gcgccgagcg cgaatacgcg gccgacgaga acatccgcaa ctccacgcgc gccaccgact 3840 
tcatcacgcc caagagcgag atcagccgcc tgtttcgcga cgccgtgctg gacctggcgc 3900 
gcgaccatga attcgcgcgc cgcatcgtca acagcgggcg gctgtccgtg ccggccacgc 3960 
tgcacggctc cgcgctcaac acgcctgaca ccgacacctt cgacggaacg cagctgcccg 4020 
gcgccgtgct ggccgatgcg cccatgcgcc ggcccggcgc agacggcacg gcctggctgc 4080 
tgcgcgcact gggaccggac ttcacgctgc tgcacttcga ccccacgccc gcctgggcgc 4140 
aggcgctgcc cggcgtgctc aacctgtcca tcgcggccga gggcgaggcc catgcgccag 4200 
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acgccgacct 


catcgatgcg 


cgcggcctgg 


ccagctacct 


gctgcggcct 


gaccagcatg 


ccagcgtgcg 


cgccgcgctg 


caaagagcct 


aagcttatcg 


ataccgtcga 


cgaatttccc 


cttaagattg 


aatcctgttg 


ccggtcttgc 


cgttaagcat 


gtaataatta 


acatgtaatg 


gattagagtc 


ccgcaattat 


acatttaata 


ctaggataaa 


ttatcgcgcg 


cggtgtcatc 


cgaggcatgg 


atacactaag 


ttcccctgaa 


cccagagcaa 


gatagtttgt 


gctgcaagtg 


aatttacttg 


tggctttgac 


atgtcgtgtg 


aattattttt 


gttaatgtga 


ttttaaaacc 


agtgtgttct 


tgtggtctat 


agtttctcaa 


caattgataa 


cttggtatac 


acaaactttg 


ggcaataccc 


attgtatgtt 


ccaatatcaa 


tatgattgtc 


attgtttttc 


cagtatcaat 


atcactatat 


tataaatctt 


tttcggttgt 


agcatgtgaa 


aattttcaaa 


taatgtgatg 


ttgccgcttc 


attaccctaa 


tttgtggcgc 


gctatcactg 


ccatcacgcg 


gatcactaat 


ttatacatca 


ttttattgta 


cacacggatc 


tctgattgct 


caaaaaatag 


actctccgtc 


tcacccaaat 


ctactcttaa 


ccgttcttct 


tagaggatcc 


aagcttatcg 


atttcgaacc 


ggtggcgcag 


gtcctcagca 


gctatgtcag 


cgtctacttc 


ctggacgccg 


ccgagaagga 


aggtgecgcc 


atcgcggcgg 


cggacgccta 


gaccaccacc 


tacggccccg 


gttacaccaa 


ggcgcagatc 


cccgtggtgc 


tcgtcaccgg 


ggacgtggac 


caggccgcga 


tcgccgccgg 


tgaagccgca 


ggctccatca 


cgcaggaagc 


cgtcgtgatc 


gccgttccat 


acgacctgtc 


cgtgccgccg 


gcggcctcgg 


ttccggacgc 


agtgcgggcg 


gccgaattgc 


tggcgggcgc 



cggccaaacg 


cctggatgca 


cgccccggca 


4260 


tctgcgcgcg 


ctggcgccgc 


cccgaEigaag 


4320 


gcggcgccgc 


cgccacggcc 


tgaacctctt 


4380 


cgatcgttca 


aacatttggc 


aataaagttt 


4440 


gatgattatc 


atataatttc 


tgttgaatta 


4500 


catgacgtta 


tttatgagat 


gggtttttat 


4560 


cgcgatagaa 


aacaaaatat 


agcgcgcaaa 


4 620 


tatgttccta 


ggtcgaggag 


aaatatgagt 


4680 


gtgagcatga 


tctttgatgc 


tgagatgatt 


4740 


acacaattgt 


aatgaaacca 


ccactcaacg 


4800 


ctctgtttgt 


atttgtgagt 


gccggttggt 


4860 


tcttatgtaa 


atagttactt 


tatctattga 


4920 


agggaaatta 


aaatgttgac 


atcccattta 


4 980 


taaatttggt 


gatatttatg 


gtcgaaagaa 


5040 


tatcaatacg 


ataacttgat 


aatactaaca 


5100 


atacattaag 


ctactacaaa 


attagtataa 


5160 


aacttgtaat 


tcgtgggttt 


ttaaaataaa 


5220 


gcgcaatttt 


attttccgag 


ttccaaaata 


5280 


cacatgtaaa 


acaaaagacg 


attcttagtg 


5340 


atgaaccgtc 


gattaaaaca 


gatcgacggt 


5400 


gatatctcag 


ccgttagatt 


taatatgcga 


54 60 


tttgcctata 


aaaacaattt 


cacatctttc 


5520 


tcttctacag 


acatcaattt 


ctctcgactc 


5580 


cctcatgact 


tcacttacag 


tgtccggccg 


5640 


cgatgtgttc 


ggtgtgatgg 


gcaacggaaa 


5700 


gggcctccgc 


ttcacggccg 


tacgccatga 


5760 


ctatcgggca 


tccgggcgcc 


tggcggcggg 


5820 


cgccctgacg 


gccctcgccg 


aggcggtcca 


5880 


ggacgccccg 


agcagcggcg 


cccggccttg 


5940 


gctgggggcg 


gcgaccttca 


cggtcacccg 


6000 


ggtggagtac 


gcacttgccc 


ggcggaccgc 


6060 


ggcccttgag 


gcggcggagg 


aagatcttcc 


6120 


catcggcggc 


ggactcggac 


gggcggccga 


6180 


gaagcggccg 


ctcatccttg 


ccggccgcgg 


6240 
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tgcgcacctc gcaggaaccg gccccgaact ccgggaactc gccgacdgcc tcggcgcgct 6300 
cacggccggc accgcactgg cgctgaacct gctgcagggc gaggggtacc tcggdgtcgc 6360 
gggcggcttc ggcacggata ccgccgccgg gctcatgggc gaggcggacg tggtgctcgt 6420 
ggcgggagcc agcctgaccc ccttcaccat gegcttcggc cacetgatcg gcccggacgc 6480 
caccgtgatc cagatcgaca ccgccatgga gccgacggac ccgcgggtgg acctgtttgt 6540 
cagtgcggac gcgaaggccg ctgccggccg gatcetccgg ctgctggatg acgccgccgg 6600 
ggccaatgcg tcgaaggcct ggcgcgcgga agcactcaag cgtctggccg aaggaccctg 6660 
ccaccacccc ggcaccgcag agaccacgga cggccgcctt gacccccggg bgcttgcttc 6720 
ggcactggat gccgtcctgc cggaacgccg caccgtggtc caggacggcg ggcacttcct 6780. 
gggctgggca cccatgtact ggcgcatccc ccgtcctcag gacctggtca tggtggggac 6840 
cgcgtaccag tcgatcgggc ttggcctggo cagcgccgtg ggggcgtccc gggccgtgga 6900 
cgacggcaat atcctggtgc tggcggcggg cgacggcgga ttcctgatgg gcctgtccga 6960 
cctggaatcg ctcgtgggcg cggcgagcag cgccgtcgtg gtgatctaca acgacgccgc 7020 
ctacggggcc gagatccatc agtacggctc acgggggctc accgaaaagc ccatgctgat 7080 
ccccgaagtg gacttcagcg ggattgcccg cgcgatcggg gcggaatccg caatcatccg 7140 
caagctgtcg gacctctccg cgctcacgga ctggatcgag gccggcgcca ggggaacctt 7200 
cgtggccgac tgccgcatca cctcaagcgt ccgggccccg tggctgagcg aatggatgag 7260 
ggcctcgcaa gcggcgaagg aggcggtggc gggctagggc cggcctcgtp gaaatgccgc 7320 
cctccaaccc aactcagtac cagctcaggg cgttctcagg gctgggaacg ccctgagctg 7380 
ctactcattt gttcgaactc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 7440 
agcccggggg atccactagg ggatcccccg atccgcgttt gtgttttctg ggtttctcac 7500 
ttaagcgtct gcgttttact tttgtattgg gtttggfcgtt tagtagtttg cggtagcgtt 7560 
cttgttatgt gtaattacgc tttttcttct tgcttcagca gtttcggttg aaatataaat 7620 
cgaatcaagt ttcactttat cagcgttgtt ttaaattttg gcattaaatt ggtgaaaatt 7680 
gcttcaattt tgtatctaaa tagaagagac aacatgaaat tcgacttttg acctcaaatc 7740 
ttcgaacatt tatttcctga tttcacgatg gatgaggata acgaaagggc ggttcctatg 7800 
tccgggaaag ttcccgtaga agacaatgag caaagctact gaaacgcgga cacgacgtcg 7860 
cattggtaog gatatgagtt aaaccgactc aattccttta ttaagacata aaccgatttt 7920 
ggttaaagtg taacagtgag ctgatataaa accgaaacaa accggtacaa gtttgattga 7980 
gcaacttgat gaoaaacttc agaattttgg ttattgaatg aaaatcatag tctaatcgta 8040 
aaaaatgtac agaagaaaag ctagagcaga acaaagattc tatattctgg ttccaattta 8i00 
tcatcgcttt aacgtccctc agatttgatc gggctgcagg aattcggcct gactgatcat 8160 
ttaaacacta ggtcgggaat tgcggcc 
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